Please use this identifier to cite or link to this item: http://elar.urfu.ru/handle/10995/2075
Title: Влияние векторного представления на качество классификации документов
Other Titles: Vector representations influence the quality of the classification of text documents
Authors: Колесов, А.
Issue Date: 2009
Publisher: Изд-во ПетрГУ
Citation: Колесов А. Влияние векторного представления на качество классификации документов / А. Колесов // III Российская летняя школа по информационному поиску RuSSIR'2009, 11-16 сентября 2009 г. Труды Третьей Российской конференции молодых ученых по информационному поиску / [отв. за вып. К. А. Рогова]. – Петрозаводск: Изд-во ПетрГУ, 2009. – С. 67-75.
Abstract: В данной работе рассматривается задача тематической классификации текстовых документов. Исследуется зависимость качества классификации от способа векторного представления документов. В качестве алгоритма классификации используется Метод Опорных Векторов (SVM). Исследуются два параметризованных класса векторизации документов, включающих в себя такие широко распространенные модели векторного представления, как TF-IDF, частотная и бинарная модели.
This paper deals with problem of subject classification of text documents. We study the dependence of the quality classification of the mode of the vector representations of documents. As a classification algorithm using the method of support vectors (SVM). We investigate two classes of parametrized tracing documents, which include such popular models of the vector representation, as TF-IDF, frequency, and binary models.
URI: http://elar.urfu.ru/handle/10995/2075
Conference name: Третья Российская конференция молодых ученых по информационному поиску (RuSSIR’2009)
Conference date: 11.09.2009-16.09.2009
ISBN: 978-5-8021-1051-5
Origin: RuSSIR 2009
Appears in Collections:Информационный поиск

Files in This Item:
File Description SizeFormat 
RuSSIR_2009_08.pdf3,15 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.