Дообучение больших языковых моделей для решения специализированных задач : магистерская диссертация

Молчанова, Т. А.; Molchanova, T. A.

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/140525

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.advisor	Долганов, А. Ю.	ru
dc.contributor.advisor	Dolganov, A. Yu.	en
dc.contributor.author	Молчанова, Т. А.	ru
dc.contributor.author	Molchanova, T. A.	en
dc.date.accessioned	2025-01-09T11:19:03Z	-
dc.date.available	2025-01-09T11:19:03Z	-
dc.date.issued	2024	-
dc.identifier.citation	Молчанова, Т. А. Дообучение больших языковых моделей для решения специализированных задач : магистерская диссертация / Т. А. Молчанова ; Уральский федеральный университет имени первого Президента России Б. Н. Ельцина, Институт радиоэлектроники и информационных технологий-РТФ, Кафедра информационных технологий и систем управления. — Екатеринбург, 2024. — 79 с. — Библиогр.: с. 73-79 (48 назв.).	ru
dc.identifier.uri	http://elar.urfu.ru/handle/10995/140525	-
dc.description.abstract	В выпускной квалификационной работе рассмотрены методы дообучения больших языковых моделей для решения специализированных задач. В качестве специализированной задачи был выбран мультиязычный перевод в сфере информационной безопасности. Для дообучения и оценки моделей был собран датасет из 1001 тройки параллельных предложений на русском, английском и испанском языках из документов компаний Trellix, IBM, Kaspersky и Dr. Web. В качестве моделей для дообучения были выбраны Mistral Instruct 7B и Llama Chat 7B. Дообучение моделей проводилось методами zero-shot, few-shot и PEFT ввиду ограничений исследования, заключающихся в использовании одного устройства с одной видеокартой объёмом 12-24 ГБ. Оценка качества переводов полученных моделей рассчитывалась на основе метрики BLEU.	ru
dc.description.abstract	The work is devoted to comparison of LLM-tuning methods for specific tasks. Multilingual translation in the domain of information security was chosen as a specific task. In order to tune and evaluate the models, a dataset of 1001 triples of parallel sentences in Russian, English and Spanish was collected from documentation of Trellix, IBM, Kaspersky and Dr. Web. The models that were used for tuning are Mistral Instruct 7B and Llama Chat 7B. As for the tuning technics, zero-shot, few-shot and PEFT were used due to the limitations grounded in usage of one device with one GPU of 12-24 GB. The translation capabilities of the resulting models were measured by the BLEU metric.	en
dc.format.mimetype	application/pdf	en
dc.language.iso	ru	en
dc.publisher	б. и.	ru
dc.rights	Предоставлено автором на условиях простой неисключительной лицензии	ru
dc.rights.uri	http://elar.urfu.ru/handle/10995/31613	en
dc.subject	MASTER'S THESIS	en
dc.subject	LANGUAGE MODELLING	en
dc.subject	LARGE LANGUAGE MODELS	en
dc.subject	TRANSFORMERS	en
dc.subject	MODEL TUNING	en
dc.subject	MODEL QUANTIZATION	en
dc.subject	MACHINE TRANSLATION	en
dc.subject	MULTILINGUAL MACHINE TRANSLATION	en
dc.subject	МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ	ru
dc.subject	ЯЗЫКОВОЕ МОДЕЛИРОВАНИЕ	ru
dc.subject	БОЛЬШИЕ ЯЗЫКОВЫЕ МОДЕЛИ	ru
dc.subject	ТРАНСФОРМЕРЫ	ru
dc.subject	ДООБУЧЕНИЕ МОДЕЛЕЙ	ru
dc.subject	КВАНТИЗАЦИЯ МОДЕЛЕЙ	ru
dc.subject	МАШИННЫЙ ПЕРЕВОД	ru
dc.subject	МУЛЬТИЯЗЫЧНЫЙ МАШИННЫЙ ПЕРЕВОД	ru
dc.title	Дообучение больших языковых моделей для решения специализированных задач : магистерская диссертация	ru
dc.title.alternative	LLM Tuning for Specific Tasks	en
dc.type	Master's thesis	en
dc.type	info:eu-repo/semantics/publishedVersion	en
dc.type	info:eu-repo/semantics/masterThesis	en
dc.thesis.level	Магистр	ru
dc.contributor.department	УрФУ. Институт радиоэлектроники и информационных технологий-РТФ	ru
dc.thesis.speciality	09.04.01 - Информатика и вычислительная техника	ru
dc.contributor.subdepartment	Кафедра информационных технологий и систем управления	ru
Располагается в коллекциях:	Магистерские диссертации

Файлы этого ресурса:

Файл	Описание	Размер	Формат
m_th_t.a.molchanova_2024.pdf		1,34 MB	Adobe PDF	Просмотреть/Открыть

Показать базовое описание ресурса Статистика

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.