Please use this identifier to cite or link to this item: http://elar.urfu.ru/handle/10995/140355
Title: Разработка инструмента для автоматического выявления уязвимостей в исходном коде на основе глубоких нейронных сетей : магистерская диссертация
Other Titles: Development of a tool for automatic detection of vulnerabilities in the source code based on deep neural networks
Authors: Русинова, З. Р.
Rusinova, Z. R.
metadata.dc.contributor.advisor: Долганов, А. Ю.
Dolganov, A. Y.
Issue Date: 2024
Publisher: б. и.
Citation: Русинова З. Р. Разработка инструмента для автоматического выявления уязвимостей в исходном коде на основе глубоких нейронных сетей : магистерская диссертация / З. Р. Русинова ; Уральский федеральный университет имени первого Президента России Б. Н. Ельцина, Институт радиоэлектроники и информационных технологий-РТФ, Кафедра информационных технологий и систем управления. — Екатеринбург, 2024. — 81 с. — Библиогр.: с. 74-81 (59 назв.).
Abstract: This work is devoted to the development of an automatic code testing tool that allows to effectively detect and classify vulnerabilities using deep learning methods, in particular, natural language processing methods. The paper provides an overview of existing approaches and methods of machine learning, analyzes and selects datasets and machine learning algorithms to solve the task, describes the infrastructure for conducting research and tracking their results. In the course of the study, binary classification models, multiclass classification models for determining CWE identifiers, and large language models for generating descriptions of detected vulnerabilities were studied. A new approach has also been developed to localize vulnerabilities at the line level of program code using the explainability methods of the SHAP and LIME machine learning models.
Данная работа посвящена разработке инструмента автоматического тестирования программного кода, который позволяет эффективно обнаруживать и классифицировать уязвимости с помощью методов глубокого обучения, в частности, методов обработки естественного языка. В работе представлен обзор существующих подходов и методов машинного обучения, проведен анализ и подбор наборов данных и алгоритмов машинного обучения для решения поставленной задачи, описана инфраструктура для проведения исследований и отслеживания их результатов. В ходе исследования изучены модели бинарной классификации, модели многоклассовой классификации для определения идентификаторов CWE, большие языковые модели для генерации описаний обнаруженных уязвимостей. Также был разработан новый подход для локализации уязвимостей на уровне строк программного кода с использованием методов объяснимости моделей машинного обучения SHAP и LIME.
Keywords: MASTER'S THESIS
MACHINE LEARNING
MACHINE LEARNING MODELS
VULNERABILITY DETECTION IN CODE
LARGE LANGUAGE MODELS
INTERPRETATION OF MACHINE LEARNING MODELS
МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ
МАШИННОЕ ОБУЧЕНИЕ
МОДЕЛИ МАШИННОГО ОБУЧЕНИЯ
ОБНАРУЖЕНИЕ УЯЗВИМОСТЕЙ В КОДЕ
БОЛЬШИЕ ЯЗЫКОВЫЕ МОДЕЛИ
ИНТЕРПРЕТАЦИЯ МОДЕЛЕЙ МАШИННОГО ОБУЧЕНИЯ
URI: http://elar.urfu.ru/handle/10995/140355
Access: Предоставлено автором на условиях простой неисключительной лицензии
License text: http://elar.urfu.ru/handle/10995/31613
PURE ID: 67536801
Appears in Collections:Магистерские диссертации

Files in This Item:
File Description SizeFormat 
m_th_z.r.rusinova_2024.pdf3,54 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.