Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://elar.urfu.ru/handle/10995/35640
Название: | Оценка точности классификации текстов в зависимости от их числа средствами data mining |
Авторы: | Бызова, А. К. Гольдштейн, С. Л. |
Дата публикации: | 2015 |
Издатель: | Уральский федеральный университет |
Библиографическое описание: | Бызова А. К. Оценка точности классификации текстов в зависимости от их числа средствами data mining / А. К. Бызова, С. Л. Гольдштейн // Физика. Технологии. Инновации : сборник научных трудов. — Екатеринбург : [УрФУ], 2015. — Вып. 1. — С. 224-229. |
Аннотация: | Рассматривается проблема достижения оптимальной точности классификации вербальных текстов средствами Data Mining. Эмпирически оценена точность классификации в зависимости от числа обучающих текстов и количества классов. Также автором рассматривается зависимость точности классификации от представления исходных данных для обучения классификатора: в виде научных статей и в виде словарей терминов. В работе приведены результаты обучения и тестирования классификатора при различных факторах, описанных выше. В качестве средства Data Mining выбрана программа Weka. The problem of optimal classification accuracy of verbal texts by means of Data Mining. Empirically evaluated the classification accuracy depending on the number of training texts and the number of classes. The author examines the dependence of the classification accuracy of the representation of the original data for training the classifier: in the form of scientific articles and a glossary of terms. The results of training and testing of the classifier for various factors described above. As a means of Data Mining program is selected Weka. |
Ключевые слова: | ДЕРЕВО ПРИНЯТИЙ РЕШЕНИЙ ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ КЛАССИФИКАЦИЯ ТЕКСТОВ КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА ОБУЧЕНИЕ КЛАССИФИКАТОРА WEKA DECISION TREE DATA MINING TEXT CLASSIFICATION COMPUTATIONAL LINGUISTICS SUPERVISED LEARNING WEKA |
URI: | http://elar.urfu.ru/handle/10995/35640 |
Идентификатор РИНЦ: | https://elibrary.ru/item.asp?id=25652502 |
ISBN: | 978-5-905227-08-0 |
Источники: | Физика. Технологии. Инновации. Вып. 1. — Екатеринбург, 2015 |
Располагается в коллекциях: | Конференции, семинары |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
fti_2015_37.pdf | 904,49 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.