Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/140346
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorРонкин, М. В.ru
dc.contributor.advisorRonkin, M. V.en
dc.contributor.authorМаяцкая, Е. A.ru
dc.contributor.authorMayatskaya, E. A.en
dc.date.accessioned2024-12-26T08:30:08Z-
dc.date.available2024-12-26T08:30:08Z-
dc.date.issued2024-
dc.identifier.citationМаяцкая Е. A. Исследование методов обработки естественного языка для классификации медицинских текстов разной длины : магистерская диссертация / Е. A. Маяцкая ; Уральский федеральный университет имени первого Президента России Б. Н. Ельцина, Институт радиоэлектроники и информационных технологий-РТФ, Кафедра информационных технологий и систем управления. — Екатеринбург, 2024. — 80 с. — Библиогр.: с. 74-80 (46 назв.).ru
dc.identifier.urihttp://elar.urfu.ru/handle/10995/140346-
dc.description.abstractThe object of the study is the classification of medical text sequences of different lengths. The subject of the study is methods for creating a vector representation of text data, as well as algorithms capable of processing data without restrictions on the length of the sequence. The goal of the final qualification work of the master is to study methods of natural language processing for classification of medical texts of different lengths. Research methods: analysis, mathematical modeling, synthesis, comparison, experiment. The result of the work is: a review of existing methods for processing long texts; a collected dataset including more than 18,000 medical texts; a developed approach for processing long texts and accelerating the transformer model when encoding texts of different lengths. Based on the analysis results, the developed approach achieved the best classification results and inference time compared to the methods considered in the work.en
dc.description.abstractОбъект исследования – классификация медицинских текстовых последовательностей разной длины. Предметом исследования являются методы по созданию векторного представления текстовых данных, а также алгоритмы способные обрабатывать данные без ограничения на длину последовательности. Цель выпускной квалификационной работы магистра – исследование методов обработки естественного языка для классификации медицинских текстов разной длины. Методы исследования: анализ, математическое моделирование, синтез, сравнение, эксперимент. Результатом работы является: обзор существующих методов, позволяющих обрабатывать длинные тексты; собранный набор данных, включающий более 18 000 медицинских текстов; разработанный подход, позволяющий обрабатывать длинные тексты и ускоряющий модель трансформера при кодировке текстов разной длины. По итогам анализа разработанный подход достиг наилучший результатов классификации и времени инференса по сравнению с рассматриваемыми в работе методами.ru
dc.format.mimetypeapplication/pdfen
dc.language.isoruen
dc.publisherб. и.ru
dc.rightsПредоставлено автором на условиях простой неисключительной лицензииru
dc.rights.urihttp://elar.urfu.ru/handle/10995/31613en
dc.subjectMASTER'S THESISen
dc.subjectMACHINE LEARNINGen
dc.subjectNATURAL LANGUAGE PROCESSINGen
dc.subjectLARGE LANGUAGE MODELSen
dc.subjectRECURRENT NEURAL NETWORKSen
dc.subjectМАГИСТЕРСКАЯ ДИССЕРТАЦИЯru
dc.subjectМАШИННОЕ ОБУЧЕНИЕru
dc.subjectОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКАru
dc.subjectБОЛЬШИЕ ЯЗЫКОВЫЕ МОДЕЛИru
dc.subjectРЕККУРЕНТНЫЕ НЕЙРОННЫЕ СЕТИru
dc.titleИсследование методов обработки естественного языка для классификации медицинских текстов разной длины : магистерская диссертацияru
dc.title.alternativeStudy of methods of natural language processing for classification of medical texts of different lengthsen
dc.typeMaster's thesisen
dc.typeinfo:eu-repo/semantics/publishedVersionen
dc.typeinfo:eu-repo/semantics/masterThesisen
dc.thesis.levelМагистрru
dc.contributor.departmentУрФУ. Институт радиоэлектроники и информационных технологий-РТФru
dc.thesis.speciality09.04.01 - Информатика и вычислительная техникаru
dc.contributor.subdepartmentКафедра информационных технологий и систем управленияru
local.identifier.pure67534511-
Располагается в коллекциях:Магистерские диссертации

Файлы этого ресурса:
Файл Описание РазмерФормат 
m_th_m.a.mayatskaya_2024.pdf3,38 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.