Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://elar.urfu.ru/handle/10995/2066
Название: | Алгоритм ранжирования связных структур в задачах автоматического составления обзорных рефератов новостных сюжетов |
Авторы: | Тарасов, С. |
Дата публикации: | 2008 |
Издатель: | Изд-во ТТИ ЮФУ |
Библиографическое описание: | Тарасов С. Алгоритм ранжирования связных структур в задачах автоматического составления обзорных рефератов новостных сюжетов / С. Тарасов // II Российская летняя школа по информационному поиску RuSSIR’2008, 1 – 5 сентября 2008 г., Труды Второй Российской конференции молодых ученых по информационному поиску / [отв. за вып. А. Н. Каркищенко]. – Таганрог: Изд-во ТТИ ЮФУ, 2008. – C. 90-100. |
Аннотация: | Работа посвящена одной из актуальных проблем автоматического реферирования – составлению обзорных рефератов по набору документов. Рассмотрен новый на сегодняшний день алгоритм
ранжирования связных структур (Manifold Ranking Algorithm) применительно к автоматическому реферированию новостных
сюжетов. Алгоритм позволяет учитывать как зависимости между предложениями внутри одного документа, так и зависимости между всеми предложениями коллекции. Проведен анализ возможности использования алгоритма для русского языка. Построена пробная система автоматического реферирования. Приведены результаты работы системы. Сформулированы основные проблемы
реализации системы и возможные методы их решения. Оценка качества работы системы произведена при помощи критерия ROUGE. Произведено сравнение результатов работы построенной системы с результатами в DUC 2003, DUC 2005. This work deals with one of the topical problems of automatic summarization – multi-document summarization in respect to news stories. This paper presents a novel extractive approach based on manifold-ranking of sentences to this summarization task. The manifold-ranking algorithm differentiates the intra-document and inter-document links between sentences with different weights. The possibility of the use the algorithm for Russian language is analyzed. A sample system for automatic summarization is build. This paper represents the sample summaries and describes experiments of summarization evaluation. The main problems of implementation of the system and possible methods of their solutions are formulated. The ROUGE criteria was used for evaluation. The results of work of built system are compared with the results of DUC 2003, DUC 2005. |
URI: | http://elar.urfu.ru/handle/10995/2066 |
Конференция/семинар: | Вторая Российская конференция молодых ученых по информационному поиску (RuSSIR'2008) |
Дата конференции/семинара: | 1.09.2008-5.09.2008 |
Идентификатор РИНЦ: | 978-5-8327-0295-7 |
Источники: | RuSSIR 2008 |
Располагается в коллекциях: | Информационный поиск |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
RuSSIR_2008_09.pdf | 167,83 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.