Исследование подходов к поиску и исправлению фактологических ошибок в отклике большой языковой модели : магистерская диссертация

Шатилов, М. Р.; Shatilov, M. R.

Please use this identifier to cite or link to this item: http://elar.urfu.ru/handle/10995/140370

Title:	Исследование подходов к поиску и исправлению фактологических ошибок в отклике большой языковой модели : магистерская диссертация
Other Titles:	Research of approaches to verification and correction of response content of a Large Language Model
Authors:	Шатилов, М. Р. Shatilov, M. R.
metadata.dc.contributor.advisor:	Ронкин, М. В. Ronkin, M. V.
Issue Date:	2024
Publisher:	б. и.
Citation:	Шатилов М. Р. Исследование подходов к поиску и исправлению фактологических ошибок в отклике большой языковой модели : магистерская диссертация / М. Р. Шатилов ; Уральский федеральный университет имени первого Президента России Б. Н. Ельцина, Институт радиоэлектроники и информационных технологий-РТФ, Кафедра информационных технологий и систем управления. — Екатеринбург, 2024. — 61 с. — Библиогр.: с. 55-61 (45 назв.).
Abstract:	The purpose of the work is to research and develop a system that implements automatic verification and correction of factual errors in text generated by a large language model, within limited computing resources. The object of study is large language models. The subject of the study is the verification and correction of text generated by a large language model. A study of existing approaches to correcting the response of a large language model was conducted, RAG method was recognized as the most appropriate method to enrich the knowledge of the model and prevent its hallucinations. The result of the work was the design and development of original RAG system. The system was evaluated for effectiveness in preventing hallucinations, determined that the system detects 93% of false facts in texts generated by Alpaca 13B, and 84% of false facts in a ChatGPT response. Целью работы является исследование и разработка системы, реализующую автоматический поиск и коррекцию фактологических ошибок в тексте, сгенерированных большой языковой моделью, в рамках ограниченных вычислительных ресурсов. Объект исследования – большие языковые модели. Предмет исследования – анализ и коррекция текста, сгенерированного большой языковой моделью. Проведено исследование существующих подходов к коррекции отклика большой языковой модели, метод RAG признан наиболее подходящим способом обогатить знания модели и предотвратить появление галлюцинаций в её отклике. Результатом работы стало проектирование и разработка собственной RAG-системы. Система была протестирована на предмет эффективности в борьбе с галлюцинациями, определено, что в среднем система обнаруживает 93% неверных фактов в текстах, сгенерированных Alpaca 13B, и 84% неверных фактов в аналогичном отклике ChatGPT.
Keywords:	MASTER'S THESIS ARTIFICIAL INTELLIGENCE NATURAL LANGUAGE PROCCESSING LARGE LANGUAGE MODEL RAG HALLUCINATION FACTCHECKING МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА БОЛЬШАЯ ЯЗЫКОВАЯ МОДЕЛЬ RAG ГАЛЛЮЦИНАЦИИ БОЛЬШОЙ ЯЗЫКОВОЙ МОДЕЛИ ФАКТЧЕКИНГ
URI:	http://elar.urfu.ru/handle/10995/140370
Access:	Предоставлено автором на условиях простой неисключительной лицензии
License text:	http://elar.urfu.ru/handle/10995/31613
PURE ID:	67541218
Appears in Collections:	Магистерские диссертации

Files in This Item:

File	Description	Size	Format
m_th_m.r.shatilov_2024.pdf		1,91 MB	Adobe PDF	View/Open

Show full item record