Please use this identifier to cite or link to this item:
http://elar.urfu.ru/handle/10995/2061
Title: | Автоматическая классификация текстов на основе их структурных признаков. Какую информацию о тексте отражает структура? |
Authors: | Пустыльникова, О. Мелер, А. |
Issue Date: | 2008 |
Publisher: | Изд-во ТТИ ЮФУ |
Citation: | Пустыльникова О. Автоматическая классификация текстов на основе их структурных признаков. Какую информацию о тексте отражает структура? / О. Пустыльникова, А. Мелер // II Российская летняя школа по информационному поиску RuSSIR’2008, 1 – 5 сентября 2008 г., Труды Второй Российской конференции молодых ученых по информационному поиску / [отв. за вып. А. Н. Каркищенко]. – Таганрог: Изд-во ТТИ ЮФУ, 2008. – C. 24-32. |
Abstract: | Эта работа представляет алгоритм для автоматической классификации текстовых документов в тематические области. Алгоритм воздействует только на текстовую структуру, игнорируя любую дополнительную информацию. Мы представляем оценку подхода, использующего SUSANNE корпус [1] письменного английского и LUCY корпус, основанный на текстах написанных взрослыми, детьми и подростками [1]. Мы показали, что, используя только небольшое количество особенностей возможно достигнуть хороших результатов классификации. This paper presents an algorithm to automatically classify text documents into thematic fields. The algorithm operates only on text structure disregarding any content information. We present an evaluation of the approach using the SUSANNE corpus [1] of written English and LUCY, a corpus of adult, child and young adult writing [1]. We show that using only a small number of features it is possible to achieve good classification results. |
URI: | http://elar.urfu.ru/handle/10995/2061 |
Conference name: | Вторая Российская конференция молодых ученых по информационному поиску (RuSSIR'2008) |
Conference date: | 1.09.2008-5.09.2008 |
ISBN: | 978-5-8327-0295-7 |
Origin: | RuSSIR 2008 |
Appears in Collections: | Информационный поиск |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
RuSSIR_2008_04.pdf | 159,89 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.