Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/128294
Название: Подготовка документов для машинного обучения в системе управления конференциями
Авторы: Куят, А. А.
Кузьмич, А. А.
Гурин, И. А.
Дата публикации: 2023
Издатель: Уральский федеральный университет
Библиографическое описание: Куят А. А. Подготовка документов для машинного обучения в системе управления конференциями / А. А. Куят, А. А. Кузьмич, И. А. Гурин . — Текст : непосредственный // Теплотехника и информатика в образовании, науке и производстве : сборник докладов XI Всероссийской научно-практической конференции студентов, аспирантов и молодых учёных (TИМ’2023) с международным участием (Екатеринбург, 18–19 мая 2023 г.). — Екатеринбург : УрФУ, 2023. — С. 177-181.
Аннотация: Представлена информация о подсистеме извлечения текста из форматированных документов в форматах Microsoft Word и PDF с целью подготовки датасета для машинного обучения и в дальнейшем классификации документов. Подсистема построена на базе платформы .NET и является частью системы управления конференциями. Представлены сравнительные характеристики различных библиотек и архитектура системы, которая может использовать созданные модели машинного обучения.
Information about the subsystem for extracting text from formatted documents in Microsoft Word and PDF formats is presented. The purpose of the subsystem is to prepare a dataset for machine learning and further classify documents. The subsystem is based on the .NET platform and is part of the conference management system. Comparative characteristics of various libraries and system architecture that can use the created machine learning models are presented.
Ключевые слова: ИЗВЛЕЧЕНИЕ
ТЕКСТ
ДОКУМЕНТ
ДАТАСЕТ
МАШИННОЕ ОБУЧЕНИЕ
ПОДГОТОВКА
РАЗРАБОТКА
EXTRACTION
TEXT
DOCUMENT
DATASET
MACHINE LEARNING
PREPARATION
DEVELOPMENT
URI: http://elar.urfu.ru/handle/10995/128294
Конференция/семинар: XI Всероссийская научно-практическая конференциия студентов, аспирантов и молодых учёных «Теплотехника и информатика в образовании, науке и производстве» (ТИМ’2023) с международным участием
Дата конференции/семинара: 18.05.2023-19.05.2023
ISBN: 978-5-6044322-6-6
Источники: Теплотехника и информатика в образовании, науке и производстве (ТИМ'2023). — Екатеринбург, 2023
Располагается в коллекциях:Конференции, семинары

Файлы этого ресурса:
Файл Описание РазмерФормат 
978-5-6044322-6-6_2023_039.pdf415 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.