Please use this identifier to cite or link to this item:
http://elar.urfu.ru/handle/10995/140536
Title: | Проектирование цифрового сервиса извлечения из текстов вакансий структурированной информации о требованиях к соискателю с использованием технологий обработки естественного языка : магистерская диссертация |
Other Titles: | Designing a digital service for extracting structured information about job requirements from job texts using natural language processing technologies |
Authors: | Савоськина, С. В. Savoskina, S. V. |
metadata.dc.contributor.advisor: | Коломыцева, А. О. Kolomytseva, A. O. |
Issue Date: | 2024 |
Publisher: | б. и. |
Citation: | Савоськина, С. В. Проектирование цифрового сервиса извлечения из текстов вакансий структурированной информации о требованиях к соискателю с использованием технологий обработки естественного языка : магистерская диссертация / С. В. Савоськина ; Уральский федеральный университет имени первого Президента России Б. Н. Ельцина, Институт радиоэлектроники и информационных технологий-РТФ, Кафедра информационных технологий и систем управления. — Екатеринбург, 2024. — 107 с. — Библиогр.: с. 98-107 (56 назв.). |
Abstract: | Работа посвящена решению актуальной практической задачи структуризации текстов вакансий и извлечения из них информации о требуемых навыках для обеспечения возможности применения более эффективных алгоритмов поиска в коллекции документов. Задачи обработки текстов на естественном языке в настоящее время эффективно решаются с помощью методов машинного обучения, однако большая часть из них реализована в рамках конкретных технологий и языков. Поэтому в работе рассматривается вопрос создания отдельного веб-сервиса, реализующего функции обработки текстов вакансий с использованием библиотек для машинного обучения на языке Python и предоставляющего широкому кругу сторонних приложений возможность интеграции с ним посредством RESTful API интерфейса. Структуризация текстов вакансий выполняется с использованием регулярных выражений, кластеризации и классификации, причем извлекаются не только требования к навыкам соискателя, но также и выполняется выделение структуры объявления в виде разделов и заголовков к ним. The paper is devoted to solving the actual practical problem of structuring job texts and extracting information about required skills from them to enable more efficient search algorithms in a collection of documents. Natural language text processing tasks are currently effectively solved using machine learning techniques, but most of them are implemented within specific technologies and languages. Therefore, this paper considers the creation of a separate web service that implements job text processing functions using Python machine learning libraries and provides a wide range of third-party applications with the ability to integrate with it via a RESTful API interface. Job texts are structured using regular expressions, clustering and classification, not only extracting the skill requirements of the job seeker, but also extracting the structure of the advertisement in the form of sections and their headings. |
Keywords: | MASTER'S THESIS NATURAL LANGUAGE PROCESSING TECHNOLOGIES INFORMATION EXTRACTION METHODS TEXT STRUCTURING INFORMATION SEARCH ENGINE VACANCIES SKILLS LABOR MARKET EMPLOYMENT SITES МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ ТЕХНОЛОГИИ ОБРАБОТКИ ЕСТЕСТВЕННОГО ЯЗЫКА МЕТОДЫ ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ СТРУКТУРИЗАЦИЯ ТЕКСТА ИНФОРМАЦИОННО-ПОИСКОВАЯ СИСТЕМА ВАКАНСИИ НАВЫКИ РЫНОК ТРУДА САЙТЫ ТРУДОУСТРОЙСТВА |
URI: | http://elar.urfu.ru/handle/10995/140536 |
Access: | Предоставлено автором на условиях простой неисключительной лицензии |
License text: | http://elar.urfu.ru/handle/10995/31613 |
Appears in Collections: | Магистерские диссертации |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
m_th_s.v.savoskina_2024.pdf | 5,41 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.