Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/2075
Название: Влияние векторного представления на качество классификации документов
Другие названия: Vector representations influence the quality of the classification of text documents
Авторы: Колесов, А.
Дата публикации: 2009
Издатель: Изд-во ПетрГУ
Библиографическое описание: Колесов А. Влияние векторного представления на качество классификации документов / А. Колесов // III Российская летняя школа по информационному поиску RuSSIR'2009, 11-16 сентября 2009 г. Труды Третьей Российской конференции молодых ученых по информационному поиску / [отв. за вып. К. А. Рогова]. – Петрозаводск: Изд-во ПетрГУ, 2009. – С. 67-75.
Аннотация: В данной работе рассматривается задача тематической классификации текстовых документов. Исследуется зависимость качества классификации от способа векторного представления документов. В качестве алгоритма классификации используется Метод Опорных Векторов (SVM). Исследуются два параметризованных класса векторизации документов, включающих в себя такие широко распространенные модели векторного представления, как TF-IDF, частотная и бинарная модели.
This paper deals with problem of subject classification of text documents. We study the dependence of the quality classification of the mode of the vector representations of documents. As a classification algorithm using the method of support vectors (SVM). We investigate two classes of parametrized tracing documents, which include such popular models of the vector representation, as TF-IDF, frequency, and binary models.
URI: http://elar.urfu.ru/handle/10995/2075
Конференция/семинар: Третья Российская конференция молодых ученых по информационному поиску (RuSSIR’2009)
Дата конференции/семинара: 11.09.2009-16.09.2009
ISBN: 978-5-8021-1051-5
Источники: RuSSIR 2009
Располагается в коллекциях:Информационный поиск

Файлы этого ресурса:
Файл Описание РазмерФормат 
RuSSIR_2009_08.pdf3,15 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.