Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://elar.urfu.ru/handle/10995/61616
Название: | Создание системы сбора и обработки открытых данных с ресурсов сети интернет |
Авторы: | Пухов, С. И. |
Дата публикации: | 2018 |
Издатель: | ООО АМК «День РА» |
Библиографическое описание: | Пухов С. И. Создание системы сбора и обработки открытых данных с ресурсов сети интернет / С. И. Пухов // Теплотехника и информатика в образовании, науке и производстве : сборник докладов VII Всероссийской научно-практической конференции студентов, аспирантов и молодых учёных (TИМ’2018) с международным участием (Екатеринбург, 17–18 мая 2018 г.). – Екатеринбург: ООО АМК «День РА», 2018. – С. 499-502. |
Аннотация: | This work is devoted to the creation of a system for automatic collection and processing of open data from Internet resources and bears practical significance in problems of text analysis. In the introduction, the relevance of the selected topic is substantiated, the goal and tasks of the research are formulated, the object and subject of the research are indicated. We consider such a task as the collection and initial processing of text data with subsequent analysis. Data collection is a priority, since open data from Internet resources are not structured and need to be processed. The author provides a system for processing HTML pages and files from the resources of educational institutions, and also leads the practical application of this approach to real data of open resources with the help of the created system. The system will help to structure the open data from the Internet resources, as well as analyze the collected data. Данная работа посвящена созданию системы автоматического сбора и обработки открытых данных с ресурсов сети интернет и несет в себе практическую значимость в задачах анализа текста. Во введении обосновывается актуальность выбранной темы, формулируются цель и задачи исследования, указывается объект и предмет исследования. Рассматривается такая задача, как сбор и первичная обработка текстовых данных с последующим анализом. Сбор данных является первоочередной задачей, так как открытые данные с ресурсов сети интернет не структурированы и нуждаются в обработке. Автор предоставляет систему обработки HTML страниц и файлов с ресурсов образовательных учреждений, а также приводит практическое применение данного подхода на реальных данных открытых ресурсов с помощью созданной системы. Система поможет структурировать открытые данные с ресурсов сети интернет, а также провести анализ собранных данных. |
Ключевые слова: | DATA COLLECTION DATA PROCESSING PROCESSING OF HTML-PAGES EDUCATIONAL INSTITUTIONS THE MINISTRY OF EDUCATION DATA ANALISIS СБОР ДАННЫХ ОБРАБОТКА ДАННЫХ ОБРАБОКА HTML-СТРАНИЦ ОБРАЗОВАТЕЛЬНЫЕ УЧРЕЖДЕНИЯ МИНИСТЕРСТВО ОБРАЗОВАНИЯ АНАЛАЗ ДАННЫХ |
URI: | http://elar.urfu.ru/handle/10995/61616 |
Конференция/семинар: | VII Всероссийская научно-практическая конференциия студентов, аспирантов и молодых учёных «Теплотехника и информатика в образовании, науке и производстве» (ТИМ’2018) с международным участием |
Дата конференции/семинара: | 17.05.2018-18.05.2018 |
ISBN: | 978-5-9908685-4-1 |
Источники: | Теплотехника и информатика в образовании, науке и производстве (ТИМ'2018) . — Екатеринбург, 2018 |
Располагается в коллекциях: | Конференции, семинары |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
tim_2018_096.pdf | 518,7 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.