Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/10995/35640
Название: Оценка точности классификации текстов в зависимости от их числа средствами data mining
Авторы: Бызова, А. К.
Гольдштейн, С. Л.
Дата публикации: 2015
Издатель: Уральский федеральный университет
Библиографическое описание: Бызова А. К. Оценка точности классификации текстов в зависимости от их числа средствами data mining / А. К. Бызова, С. Л. Гольдштейн // Физика. Технологии. Инновации : сборник научных трудов. — Екатеринбург : [УрФУ], 2015. — Вып. 1. — С. 224-229.
Аннотация: Рассматривается проблема достижения оптимальной точности классификации вербальных текстов средствами Data Mining. Эмпирически оценена точность классификации в зависимости от числа обучающих текстов и количества классов. Также автором рассматривается зависимость точности классификации от представления исходных данных для обучения классификатора: в виде научных статей и в виде словарей терминов. В работе приведены результаты обучения и тестирования классификатора при различных факторах, описанных выше. В качестве средства Data Mining выбрана программа Weka.
The problem of optimal classification accuracy of verbal texts by means of Data Mining. Empirically evaluated the classification accuracy depending on the number of training texts and the number of classes. The author examines the dependence of the classification accuracy of the representation of the original data for training the classifier: in the form of scientific articles and a glossary of terms. The results of training and testing of the classifier for various factors described above. As a means of Data Mining program is selected Weka.
Ключевые слова: ДЕРЕВО ПРИНЯТИЙ РЕШЕНИЙ
ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ
КЛАССИФИКАЦИЯ ТЕКСТОВ
КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА
ОБУЧЕНИЕ КЛАССИФИКАТОРА
WEKA
DECISION TREE
DATA MINING
TEXT CLASSIFICATION
COMPUTATIONAL LINGUISTICS
SUPERVISED LEARNING
WEKA
URI: http://hdl.handle.net/10995/35640
Идентификатор РИНЦ: http://elibrary.ru/item.asp?id=25652502
ISBN: 978-5-905227-08-0
Источники: Физика. Технологии. Инновации. Вып. 1. — Екатеринбург, 2015.
Располагается в коллекциях:Конференции, семинары

Файлы этого ресурса:
Файл Описание РазмерФормат 
fti_2015_37.pdf904,49 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.