Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/2061
Название: Автоматическая классификация текстов на основе их структурных признаков. Какую информацию о тексте отражает структура?
Авторы: Пустыльникова, О.
Мелер, А.
Дата публикации: 2008
Издатель: Изд-во ТТИ ЮФУ
Библиографическое описание: Пустыльникова О. Автоматическая классификация текстов на основе их структурных признаков. Какую информацию о тексте отражает структура? / О. Пустыльникова, А. Мелер // II Российская летняя школа по информационному поиску RuSSIR’2008, 1 – 5 сентября 2008 г., Труды Второй Российской конференции молодых ученых по информационному поиску / [отв. за вып. А. Н. Каркищенко]. – Таганрог: Изд-во ТТИ ЮФУ, 2008. – C. 24-32.
Аннотация: Эта работа представляет алгоритм для автоматической классификации текстовых документов в тематические области. Алгоритм воздействует только на текстовую структуру, игнорируя любую дополнительную информацию. Мы представляем оценку подхода, использующего SUSANNE корпус [1] письменного английского и LUCY корпус, основанный на текстах написанных взрослыми, детьми и подростками [1]. Мы показали, что, используя только небольшое количество особенностей возможно достигнуть хороших результатов классификации.
This paper presents an algorithm to automatically classify text documents into thematic fields. The algorithm operates only on text structure disregarding any content information. We present an evaluation of the approach using the SUSANNE corpus [1] of written English and LUCY, a corpus of adult, child and young adult writing [1]. We show that using only a small number of features it is possible to achieve good classification results.
URI: http://elar.urfu.ru/handle/10995/2061
Конференция/семинар: Вторая Российская конференция молодых ученых по информационному поиску (RuSSIR'2008)
Дата конференции/семинара: 1.09.2008-5.09.2008
ISBN: 978-5-8327-0295-7
Источники: RuSSIR 2008
Располагается в коллекциях:Информационный поиск

Файлы этого ресурса:
Файл Описание РазмерФормат 
RuSSIR_2008_04.pdf159,89 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.