Использование машинного обучения для автоматической интерпретации данных из систем веб-аналитики : магистерская диссертация

Цинцов, Н. В.; Tsintsov, N. V.

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/129164

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.advisor	Долганов, А. Ю.	ru
dc.contributor.advisor	Dolganov, A. Y.	en
dc.contributor.author	Цинцов, Н. В.	ru
dc.contributor.author	Tsintsov, N. V.	en
dc.date.accessioned	2024-01-12T10:58:44Z	-
dc.date.available	2024-01-12T10:58:44Z	-
dc.date.issued	2023	-
dc.identifier.citation	Цинцов, Н. В. Использование машинного обучения для автоматической интерпретации данных из систем веб-аналитики : магистерская диссертация / Н. В. Цинцов ; Уральский федеральный университет имени первого Президента России Б. Н. Ельцина, Институт радиоэлектроники и информационных технологий-РТФ, Кафедра информационных технологий и систем управления. — Екатеринбург, 2023. — 63 с. — Библиогр.: с. 61-63 (30 назв.).	ru
dc.identifier.uri	http://elar.urfu.ru/handle/10995/129164	-
dc.description.abstract	В данной работе был разработан и реализован комплексный подход к анализу и интерпретации пользовательских данных, собранных в рамках системы веб-аналитики. Применяя методы машинного обучения и аналитики данных, были исследованы и выявлены ключевые события пользователей, влияющие на определенные бизнес-метрики. Начальные этапы проекта включали сбор и предварительную обработку данных, с последующей кластеризацией для выявления скрытых взаимосвязей и структур. Использовались или тестировались различные библиотеки для объяснимости работы моделей машинного обучении, такие как Eli5 и SHAP. Для решения задачи тестировались кластеризации, включая K-средних, DBSCAN, спектральную кластеризацию и OPTICS. В качестве алгоритмов применялась логистическая регрессия, случайны лес и CatBoost. Применялась нейронная сеть. Для определения значимости признаков использовались методы Permutation Importance, с применением моделей логистической регрессии, случайного леса и нейронной сети. Основным результатом стала разработка скрипта, осуществляющего автоматический сбор, обработку данных и определение наиболее значимых событий. Полученный инструментарий значительно облегчает задачу аналитиков, помогая определять ключевые аспекты поведения пользователей и строить более эффективные стратегии взаимодействия. Применение полученных результатов имеет высокий потенциал для улучшения бизнес–решений и оптимизации работы с пользовательской аудиторией.	ru
dc.description.abstract	In this work, an integrated approach to the analysis and interpretation of user data collected within the framework of a web analytics system was developed and implemented. Using machine learning and data analytics methods, key user events that impact certain business metrics were investigated and identified. The initial stages of the project included data collection and pre-processing, followed by clustering to identify hidden relationships and structures. Various libraries have been used or tested to make machine learning models explainable, such as Eli5 and SHAP. Clusterings including K-means, DBSCAN, spectral clustering, and OPTICS were tested to solve the problem. The algorithms used were logistic regression, random forest and CatBoost. A neural network was used. To determine the significance of features, Permutation Importance methods were used using logistic regression, random forest and neural network models. The main result was the development of a script that automatically collects, processes data and determines the most significant events. The resulting tools greatly facilitate the task of analysts, helping to identify key aspects of user behavior and build more effective interaction strategies. The application of the results obtained has high potential for improving business decisions and optimizing work with the user audience.	en
dc.format.mimetype	application/pdf	en
dc.language.iso	ru	en
dc.rights	Предоставлено автором на условиях простой неисключительной лицензии	ru
dc.rights.uri	http://elar.urfu.ru/handle/10995/31613
dc.subject	МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ	ru
dc.subject	СИСТЕМЫ ВЕБ-АНАЛИТИКИ	ru
dc.subject	БИЗНЕС-МЕТРИКИ	ru
dc.subject	ELI5	ru
dc.subject	SHAP	ru
dc.subject	K-СРЕДНИХ	ru
dc.subject	DBSCAN	ru
dc.subject	СПЕКТРАЛЬНУЮ КЛАСТЕРИЗАЦИЮ	ru
dc.subject	OPTICS	ru
dc.subject	CATBOOST	ru
dc.subject	PERMUTATION IMPORTANCE	ru
dc.subject	ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ	ru
dc.subject	СЛУЧАЙНЫЙ ЛЕС	ru
dc.subject	MASTER'S THESIS	en
dc.subject	WEB ANALYTICS SYSTEMS	en
dc.subject	BUSINESS METRICS	en
dc.subject	ELI5	en
dc.subject	SHAP	en
dc.subject	K-MEANS	en
dc.subject	DBSCAN	en
dc.subject	SPECTRAL CLUSTERING	en
dc.subject	OPTICS	en
dc.subject	CATBOOST	en
dc.subject	PERMUTATION IMPORTANCE	en
dc.subject	LOGISTIC REGRESSION	en
dc.subject	RANDOM FOREST	en
dc.title	Использование машинного обучения для автоматической интерпретации данных из систем веб-аналитики : магистерская диссертация	ru
dc.title.alternative	Using machine learning to automatically interpret data from web analytics systems	en
dc.type	Master's thesis	en
dc.type	info:eu-repo/semantics/publishedVersion	en
dc.type	info:eu-repo/semantics/masterThesis	en
dc.thesis.level	Магистр	ru
dc.contributor.department	УрФУ. Институт радиоэлектроники и информационных технологий-РТФ	ru
dc.thesis.speciality	09.04.01 - Информатика и вычислительная техника	ru
dc.contributor.subdepartment	Кафедра информационных технологий и систем управления	ru
Располагается в коллекциях:	Магистерские диссертации

Файлы этого ресурса:

Файл	Описание	Размер	Формат
m_th_n.v.tsintsov_2023.pdf		2,08 MB	Adobe PDF	Просмотреть/Открыть

Показать базовое описание ресурса Статистика

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.