Please use this identifier to cite or link to this item: http://elar.urfu.ru/handle/10995/61616
Title: Создание системы сбора и обработки открытых данных с ресурсов сети интернет
Authors: Пухов, С. И.
Issue Date: 2018
Publisher: ООО АМК «День РА»
Citation: Пухов С. И. Создание системы сбора и обработки открытых данных с ресурсов сети интернет / С. И. Пухов // Теплотехника и информатика в образовании, науке и производстве : сборник докладов VII Всероссийской научно-практической конференции студентов, аспирантов и молодых учёных (TИМ’2018) с международным участием (Екатеринбург, 17–18 мая 2018 г.). – Екатеринбург: ООО АМК «День РА», 2018. – С. 499-502.
Abstract: This work is devoted to the creation of a system for automatic collection and processing of open data from Internet resources and bears practical significance in problems of text analysis. In the introduction, the relevance of the selected topic is substantiated, the goal and tasks of the research are formulated, the object and subject of the research are indicated. We consider such a task as the collection and initial processing of text data with subsequent analysis. Data collection is a priority, since open data from Internet resources are not structured and need to be processed. The author provides a system for processing HTML pages and files from the resources of educational institutions, and also leads the practical application of this approach to real data of open resources with the help of the created system. The system will help to structure the open data from the Internet resources, as well as analyze the collected data.
Данная работа посвящена созданию системы автоматического сбора и обработки открытых данных с ресурсов сети интернет и несет в себе практическую значимость в задачах анализа текста. Во введении обосновывается актуальность выбранной темы, формулируются цель и задачи исследования, указывается объект и предмет исследования. Рассматривается такая задача, как сбор и первичная обработка текстовых данных с последующим анализом. Сбор данных является первоочередной задачей, так как открытые данные с ресурсов сети интернет не структурированы и нуждаются в обработке. Автор предоставляет систему обработки HTML страниц и файлов с ресурсов образовательных учреждений, а также приводит практическое применение данного подхода на реальных данных открытых ресурсов с помощью созданной системы. Система поможет структурировать открытые данные с ресурсов сети интернет, а также провести анализ собранных данных.
Keywords: DATA COLLECTION
DATA PROCESSING
PROCESSING OF HTML-PAGES
EDUCATIONAL INSTITUTIONS
THE MINISTRY OF EDUCATION
DATA ANALISIS
СБОР ДАННЫХ
ОБРАБОТКА ДАННЫХ
ОБРАБОКА HTML-СТРАНИЦ
ОБРАЗОВАТЕЛЬНЫЕ УЧРЕЖДЕНИЯ
МИНИСТЕРСТВО ОБРАЗОВАНИЯ
АНАЛАЗ ДАННЫХ
URI: http://elar.urfu.ru/handle/10995/61616
Conference name: VII Всероссийская научно-практическая конференциия студентов, аспирантов и молодых учёных «Теплотехника и информатика в образовании, науке и производстве» (ТИМ’2018) с международным участием
Conference date: 17.05.2018-18.05.2018
ISBN: 978-5-9908685-4-1
Origin: Теплотехника и информатика в образовании, науке и производстве (ТИМ'2018) . — Екатеринбург, 2018
Appears in Collections:Конференции, семинары

Files in This Item:
File Description SizeFormat 
tim_2018_096.pdf518,7 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.