Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/140347
Название: Решение задачи QA для низкоресурсных языков тюркской языковой группы : магистерская диссертация
Другие названия: Solving the QA task for low-resource languages of the Turkic language group
Авторы: Медовиков, А. А.
Medovikov, A. A.
Научный руководитель: Сорокин, А. К.
Sorokin, A. K.
Дата публикации: 2024
Издатель: б. и.
Библиографическое описание: Медовиков А. А. Решение задачи QA для низкоресурсных языков тюркской языковой группы : магистерская диссертация / А. А. Медовиков ; Уральский федеральный университет имени первого Президента России Б. Н. Ельцина, Институт радиоэлектроники и информационных технологий-РТФ, Кафедра информационных технологий и систем управления. — Екатеринбург, 2024. — 71 с. — Библиогр.: с. 51-58 (78 назв.).
Аннотация: The purpose of the work is to conduct a comprehensive study of the solution of the QA task for low-resource languages using the example of the Kazakh and Uzbek languages, creating models and datasets in the corresponding languages, using machine translation of datasets from high-resource languages using special markers. The hypothesis of the importance of proximity of languages in choosing the source language for translation is also being investigated. QA models have been created that demonstrate better results for the Kazakh and Uzbek languages than all other publicly available models.
Цель работы состоит в том, чтобы провести комплексное исследование решения задачи QA для низкоресурсных языков в виде казахского и узбекского языка, создав модели и датасеты на соответствующих языках, при помощи машинного перевода датасетов на высокоресурсных языках с использованием специальных маркеров. Также исследуется гипотеза о важности близости языков при выборе языка источника для перевода. Созданы QA-модели, демонстрирующие лучшие результаты для казахского и узбекского языков, чем все другие публично доступные модели.
Ключевые слова: MASTER'S THESIS
ML
NLP
QA
QUESTION ANSWERING
EXTRACTIVE QUESTION ANSWERING
LOW-RESOURCE LANGUAGE
KAZAKH LANGUAGE
UZBEK LANGUAGE
TRANSFORMERS
МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ
НИЗКОРЕСУРСНЫЕ ЯЗЫКИ
КАЗАХСКИЙ ЯЗЫК
УЗБЕКСКИЙ ЯЗЫК
ТРАНСФОРМЕРЫ
URI: http://elar.urfu.ru/handle/10995/140347
Условия доступа: Предоставлено автором на условиях простой неисключительной лицензии
Текст лицензии: http://elar.urfu.ru/handle/10995/31613
Идентификатор PURE: 67534779
Располагается в коллекциях:Магистерские диссертации

Файлы этого ресурса:
Файл Описание РазмерФормат 
m_th_a.a.medovikov_2024.pdf1,72 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.