Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://elar.urfu.ru/handle/10995/140368
Название: | Предсказание кредитных рисков с помощью машинного обучения : магистерская диссертация |
Другие названия: | Prediction of credit risks using machine learning |
Авторы: | Чераева, О. Р. Cheraeva, O. R. |
Научный руководитель: | Акимова, Е. Н. Akimova, E. N. |
Дата публикации: | 2024 |
Издатель: | б. и. |
Библиографическое описание: | Чераева О. Р. Предсказание кредитных рисков с помощью машинного обучения : магистерская диссертация / О. Р. Чераева ; Уральский федеральный университет имени первого Президента России Б. Н. Ельцина, Институт радиоэлектроники и информационных технологий-РТФ, Кафедра информационных технологий и систем управления. — Екатеринбург, 2024. — 64 с. — Библиогр.: с. 59-64 (46 назв.). |
Аннотация: | This diploma work consists of three chapters and is devoted to the prediction of credit risks using machine learning methods, in particular, to finding the most effective model for predicting credit risk. An analysis of scientific literature was conducted in order to identify the most popular models in this area, as well as data sets that can be used for their subsequent training. The found sets containing data on credit risk were analyzed, transformed, normalized and sent to train several models: logistic regression, decision tree, random forest, support vector machine, k-nearest neighbors, XGBoost and CatBoost. When training the models mentioned above, the imbalance between credit risk classes was taken into account - methods for combating unbalanced classes were considered. The results obtained during the work were presented in the form of tables with metric values. The work of some of the considered machine learning models was interpreted using the SHAP library. In conclusion of this study, a conclusion was made about which of the considered models showed the highest results in determining credit risk. Данная дипломная работа состоит из трех глав и посвящена предсказанию кредитных рисков с помощью методов машинного обучения, в частности, поиску наиболее эффективной для предсказания кредитного риска модели. Был проведен анализ научной литературы в целях выявления наиболее популярных в данной сфере моделей, а также наборов данных, которые могут быть использованы для их последующего обучения.Найденные наборы, содержащие в себе данные о кредитном риске, были проанализированы, преобразованы, нормализованы и отправлены на обучение нескольких моделей: логистическая регрессия, дерево решений, случайный лес, метод опорных векторов, метод k-ближайших соседей, XGBoost и CatBoost. При обучении упомянутых ранее моделей учитывался дисбаланс между классами кредитного риска – рассмотрены методы борьбы с несбалансированными классами. Полученные в ходе работы результаты представили в виде таблиц со значениями метрик. Работу некоторых рассмотренных моделей машинного обучения удалось интерпретировать с помощью библиотеки SHAP. В заключении данного исследования был сделан вывод о том, какие из рассматриваемых моделей показали наивысшие результаты при определении кредитного риска. |
Ключевые слова: | MASTER'S THESIS CREDIT RISK FINANCIAL DEFAULT MACHINE LEARNING METHODS CLASS IMBALANCE МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ КРЕДИТНЫЙ РИСК ФИНАНСОВЫЙ ДЕФОЛТ МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ НЕСБАЛАНСИРОВАННОСТЬ КЛАССОВ |
URI: | http://elar.urfu.ru/handle/10995/140368 |
Условия доступа: | Предоставлено автором на условиях простой неисключительной лицензии |
Текст лицензии: | http://elar.urfu.ru/handle/10995/31613 |
Идентификатор PURE: | 67540136 |
Располагается в коллекциях: | Магистерские диссертации |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
m_th_o.r.cheraeva_2024.pdf | 2,14 MB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.