Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/119188
Название: Добыча данных с помощью функций и библиотек языка Python : магистерская диссертация
Другие названия: Data mining with Python language functions and libraries
Авторы: Аль-Мамури, М. О. Х.
Al-Mamuri, A. H.
Научный руководитель: Аксенов, К. А.
Aksenov, K. A.
Дата публикации: 2022
Издатель: б. и.
Библиографическое описание: Аль-Мамури М. О. Х. Добыча данных с помощью функций и библиотек языка Python : магистерская диссертация / М. О. Х. Аль-Мамури ; Уральский федеральный университет имени первого Президента России Б. Н. Ельцина, Институт радиоэлектроники и информационных технологий - РтФ, Школа профессионального и академического образования. — Екатеринбург, 2022. — 55 с. — Библиогр.: с. 55-55 (10 назв.).
Аннотация: Данная работа включает изучение алгоритмов машинного обучения (регрессии и классификации) на примере данных открытых источников Covid-19. Исходные данные для исследования взяты с веб-сайта Европейский центр по профилактике и контролю заболеваний в формате CSV. Для решения задачи использовались библиотеки Pyton: pandas, NumPy, Matplotlib, Seaborn, Sklearn. В ходе исследования исследованы возможности библиотек и функций Python для предварительной обработки данных путем удаления NULL-полей и преобразования их в нулевые, а затем выполнен процесс извлечения данных с помощью библиотек и функций Python и то, как отображать информацию в различных формах в виде таблиц, графиков или временных рядов. Применение агломеративной кластеризации к данным, как показал график распределения, не позволило достаточно точно провести разбивку данных на группы. Использование алгоритма кластеризации BIRCH позволило более точно решить данную задачу.
Through the master's research, we will use the Covid-19 data file for the year 2020, and the Covid-19 data file for the year 2021 and early 2022 year The file is in (csv) format for all countries of the world to show cases of injuries and deaths. Through the study, we will show the ability of Python libraries and functions to pre-process data by removing NULL fields and converting them to zero and then the process of extracting data using Python libraries and functions and how to show information in different forms in the form of tables, charts or time series. Then we conclude the six most important libraries in the Python language that cannot be dispensed with in the process of data mining and the most important functions used. Algorithms: regression algorithm, classification algorithm, clustering algorithm. Evaluate the results between the work of these algorithms by showing the drawing of each algorithm and deduce the best algorithm in our work only.
Ключевые слова: МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ
MASTER'S THESIS
ДОБЫЧА ДАННЫХ
КОВИД-19
ПИТОН
ЗАБОЛЕВАНИЕ
DATA MINING
COVID-19
PYTHON
PANDEMIC
URI: http://elar.urfu.ru/handle/10995/119188
Условия доступа: Предоставлено автором на условиях простой неисключительной лицензии
Текст лицензии: http://elar.urfu.ru/handle/10995/31613
Располагается в коллекциях:Магистерские диссертации

Файлы этого ресурса:
Файл Описание РазмерФормат 
m_th_a.h.al-mamuri_2022.pdf2,4 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.