Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/129164
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorДолганов, А. Ю.ru
dc.contributor.advisorDolganov, A. Y.en
dc.contributor.authorЦинцов, Н. В.ru
dc.contributor.authorTsintsov, N. V.en
dc.date.accessioned2024-01-12T10:58:44Z-
dc.date.available2024-01-12T10:58:44Z-
dc.date.issued2023
dc.identifier.citationЦинцов, Н. В. Использование машинного обучения для автоматической интерпретации данных из систем веб-аналитики : магистерская диссертация / Н. В. Цинцов ; Уральский федеральный университет имени первого Президента России Б. Н. Ельцина, Институт радиоэлектроники и информационных технологий-РТФ, Кафедра информационных технологий и систем управления. — Екатеринбург, 2023. — 63 с. — Библиогр.: с. 61-63 (30 назв.).ru
dc.identifier.urihttp://elar.urfu.ru/handle/10995/129164-
dc.description.abstractВ данной работе был разработан и реализован комплексный подход к анализу и интерпретации пользовательских данных, собранных в рамках системы веб-аналитики. Применяя методы машинного обучения и аналитики данных, были исследованы и выявлены ключевые события пользователей, влияющие на определенные бизнес-метрики. Начальные этапы проекта включали сбор и предварительную обработку данных, с последующей кластеризацией для выявления скрытых взаимосвязей и структур. Использовались или тестировались различные библиотеки для объяснимости работы моделей машинного обучении, такие как Eli5 и SHAP. Для решения задачи тестировались кластеризации, включая K-средних, DBSCAN, спектральную кластеризацию и OPTICS. В качестве алгоритмов применялась логистическая регрессия, случайны лес и CatBoost. Применялась нейронная сеть. Для определения значимости признаков использовались методы Permutation Importance, с применением моделей логистической регрессии, случайного леса и нейронной сети. Основным результатом стала разработка скрипта, осуществляющего автоматический сбор, обработку данных и определение наиболее значимых событий. Полученный инструментарий значительно облегчает задачу аналитиков, помогая определять ключевые аспекты поведения пользователей и строить более эффективные стратегии взаимодействия. Применение полученных результатов имеет высокий потенциал для улучшения бизнес–решений и оптимизации работы с пользовательской аудиторией.ru
dc.description.abstractIn this work, an integrated approach to the analysis and interpretation of user data collected within the framework of a web analytics system was developed and implemented. Using machine learning and data analytics methods, key user events that impact certain business metrics were investigated and identified. The initial stages of the project included data collection and pre-processing, followed by clustering to identify hidden relationships and structures. Various libraries have been used or tested to make machine learning models explainable, such as Eli5 and SHAP. Clusterings including K-means, DBSCAN, spectral clustering, and OPTICS were tested to solve the problem. The algorithms used were logistic regression, random forest and CatBoost. A neural network was used. To determine the significance of features, Permutation Importance methods were used using logistic regression, random forest and neural network models. The main result was the development of a script that automatically collects, processes data and determines the most significant events. The resulting tools greatly facilitate the task of analysts, helping to identify key aspects of user behavior and build more effective interaction strategies. The application of the results obtained has high potential for improving business decisions and optimizing work with the user audience.en
dc.format.mimetypeapplication/pdfen
dc.language.isoruen
dc.rightsПредоставлено автором на условиях простой неисключительной лицензииru
dc.rights.urihttp://elar.urfu.ru/handle/10995/31613
dc.subjectМАГИСТЕРСКАЯ ДИССЕРТАЦИЯru
dc.subjectСИСТЕМЫ ВЕБ-АНАЛИТИКИru
dc.subjectБИЗНЕС-МЕТРИКИru
dc.subjectELI5ru
dc.subjectSHAPru
dc.subjectK-СРЕДНИХru
dc.subjectDBSCANru
dc.subjectСПЕКТРАЛЬНУЮ КЛАСТЕРИЗАЦИЮru
dc.subjectOPTICSru
dc.subjectCATBOOSTru
dc.subjectPERMUTATION IMPORTANCEru
dc.subjectЛОГИСТИЧЕСКОЙ РЕГРЕССИИru
dc.subjectСЛУЧАЙНЫЙ ЛЕСru
dc.subjectMASTER'S THESISen
dc.subjectWEB ANALYTICS SYSTEMSen
dc.subjectBUSINESS METRICSen
dc.subjectELI5en
dc.subjectSHAPen
dc.subjectK-MEANSen
dc.subjectDBSCANen
dc.subjectSPECTRAL CLUSTERINGen
dc.subjectOPTICSen
dc.subjectCATBOOSTen
dc.subjectPERMUTATION IMPORTANCEen
dc.subjectLOGISTIC REGRESSIONen
dc.subjectRANDOM FORESTen
dc.titleИспользование машинного обучения для автоматической интерпретации данных из систем веб-аналитики : магистерская диссертацияru
dc.title.alternativeUsing machine learning to automatically interpret data from web analytics systemsen
dc.typeMaster's thesisen
dc.typeinfo:eu-repo/semantics/publishedVersionen
dc.typeinfo:eu-repo/semantics/masterThesisen
dc.thesis.levelМагистрru
dc.contributor.departmentУрФУ. Институт радиоэлектроники и информационных технологий-РТФru
dc.thesis.speciality09.04.01 - Информатика и вычислительная техникаru
dc.contributor.subdepartmentКафедра информационных технологий и систем управленияru
Располагается в коллекциях:Магистерские диссертации

Файлы этого ресурса:
Файл Описание РазмерФормат 
m_th_n.v.tsintsov_2023.pdf2,08 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.