Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://elar.urfu.ru/handle/10995/140347
Название: | Решение задачи QA для низкоресурсных языков тюркской языковой группы : магистерская диссертация |
Другие названия: | Solving the QA task for low-resource languages of the Turkic language group |
Авторы: | Медовиков, А. А. Medovikov, A. A. |
Научный руководитель: | Сорокин, А. К. Sorokin, A. K. |
Дата публикации: | 2024 |
Издатель: | б. и. |
Библиографическое описание: | Медовиков А. А. Решение задачи QA для низкоресурсных языков тюркской языковой группы : магистерская диссертация / А. А. Медовиков ; Уральский федеральный университет имени первого Президента России Б. Н. Ельцина, Институт радиоэлектроники и информационных технологий-РТФ, Кафедра информационных технологий и систем управления. — Екатеринбург, 2024. — 71 с. — Библиогр.: с. 51-58 (78 назв.). |
Аннотация: | The purpose of the work is to conduct a comprehensive study of the solution of the QA task for low-resource languages using the example of the Kazakh and Uzbek languages, creating models and datasets in the corresponding languages, using machine translation of datasets from high-resource languages using special markers. The hypothesis of the importance of proximity of languages in choosing the source language for translation is also being investigated. QA models have been created that demonstrate better results for the Kazakh and Uzbek languages than all other publicly available models. Цель работы состоит в том, чтобы провести комплексное исследование решения задачи QA для низкоресурсных языков в виде казахского и узбекского языка, создав модели и датасеты на соответствующих языках, при помощи машинного перевода датасетов на высокоресурсных языках с использованием специальных маркеров. Также исследуется гипотеза о важности близости языков при выборе языка источника для перевода. Созданы QA-модели, демонстрирующие лучшие результаты для казахского и узбекского языков, чем все другие публично доступные модели. |
Ключевые слова: | MASTER'S THESIS ML NLP QA QUESTION ANSWERING EXTRACTIVE QUESTION ANSWERING LOW-RESOURCE LANGUAGE KAZAKH LANGUAGE UZBEK LANGUAGE TRANSFORMERS МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ НИЗКОРЕСУРСНЫЕ ЯЗЫКИ КАЗАХСКИЙ ЯЗЫК УЗБЕКСКИЙ ЯЗЫК ТРАНСФОРМЕРЫ |
URI: | http://elar.urfu.ru/handle/10995/140347 |
Условия доступа: | Предоставлено автором на условиях простой неисключительной лицензии |
Текст лицензии: | http://elar.urfu.ru/handle/10995/31613 |
Идентификатор PURE: | 67534779 |
Располагается в коллекциях: | Магистерские диссертации |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
m_th_a.a.medovikov_2024.pdf | 1,72 MB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.