Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/140536
Название: Проектирование цифрового сервиса извлечения из текстов вакансий структурированной информации о требованиях к соискателю с использованием технологий обработки естественного языка : магистерская диссертация
Другие названия: Designing a digital service for extracting structured information about job requirements from job texts using natural language processing technologies
Авторы: Савоськина, С. В.
Savoskina, S. V.
Научный руководитель: Коломыцева, А. О.
Kolomytseva, A. O.
Дата публикации: 2024
Издатель: б. и.
Библиографическое описание: Савоськина, С. В. Проектирование цифрового сервиса извлечения из текстов вакансий структурированной информации о требованиях к соискателю с использованием технологий обработки естественного языка : магистерская диссертация / С. В. Савоськина ; Уральский федеральный университет имени первого Президента России Б. Н. Ельцина, Институт радиоэлектроники и информационных технологий-РТФ, Кафедра информационных технологий и систем управления. — Екатеринбург, 2024. — 107 с. — Библиогр.: с. 98-107 (56 назв.).
Аннотация: Работа посвящена решению актуальной практической задачи структуризации текстов вакансий и извлечения из них информации о требуемых навыках для обеспечения возможности применения более эффективных алгоритмов поиска в коллекции документов. Задачи обработки текстов на естественном языке в настоящее время эффективно решаются с помощью методов машинного обучения, однако большая часть из них реализована в рамках конкретных технологий и языков. Поэтому в работе рассматривается вопрос создания отдельного веб-сервиса, реализующего функции обработки текстов вакансий с использованием библиотек для машинного обучения на языке Python и предоставляющего широкому кругу сторонних приложений возможность интеграции с ним посредством RESTful API интерфейса. Структуризация текстов вакансий выполняется с использованием регулярных выражений, кластеризации и классификации, причем извлекаются не только требования к навыкам соискателя, но также и выполняется выделение структуры объявления в виде разделов и заголовков к ним.
The paper is devoted to solving the actual practical problem of structuring job texts and extracting information about required skills from them to enable more efficient search algorithms in a collection of documents. Natural language text processing tasks are currently effectively solved using machine learning techniques, but most of them are implemented within specific technologies and languages. Therefore, this paper considers the creation of a separate web service that implements job text processing functions using Python machine learning libraries and provides a wide range of third-party applications with the ability to integrate with it via a RESTful API interface. Job texts are structured using regular expressions, clustering and classification, not only extracting the skill requirements of the job seeker, but also extracting the structure of the advertisement in the form of sections and their headings.
Ключевые слова: MASTER'S THESIS
NATURAL LANGUAGE PROCESSING TECHNOLOGIES
INFORMATION EXTRACTION METHODS
TEXT STRUCTURING
INFORMATION SEARCH ENGINE
VACANCIES
SKILLS
LABOR MARKET
EMPLOYMENT SITES
МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ
ТЕХНОЛОГИИ ОБРАБОТКИ ЕСТЕСТВЕННОГО ЯЗЫКА
МЕТОДЫ ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ
СТРУКТУРИЗАЦИЯ ТЕКСТА
ИНФОРМАЦИОННО-ПОИСКОВАЯ СИСТЕМА
ВАКАНСИИ
НАВЫКИ
РЫНОК ТРУДА
САЙТЫ ТРУДОУСТРОЙСТВА
URI: http://elar.urfu.ru/handle/10995/140536
Условия доступа: Предоставлено автором на условиях простой неисключительной лицензии
Текст лицензии: http://elar.urfu.ru/handle/10995/31613
Располагается в коллекциях:Магистерские диссертации

Файлы этого ресурса:
Файл Описание РазмерФормат 
m_th_s.v.savoskina_2024.pdf5,41 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.