Алгоритм ранжирования связных структур в задачах автоматического составления обзорных рефератов новостных сюжетов

Тарасов, С.

Please use this identifier to cite or link to this item: http://elar.urfu.ru/handle/10995/2066

Title:	Алгоритм ранжирования связных структур в задачах автоматического составления обзорных рефератов новостных сюжетов
Authors:	Тарасов, С.
Issue Date:	2008
Publisher:	Изд-во ТТИ ЮФУ
Citation:	Тарасов С. Алгоритм ранжирования связных структур в задачах автоматического составления обзорных рефератов новостных сюжетов / С. Тарасов // II Российская летняя школа по информационному поиску RuSSIR’2008, 1 – 5 сентября 2008 г., Труды Второй Российской конференции молодых ученых по информационному поиску / [отв. за вып. А. Н. Каркищенко]. – Таганрог: Изд-во ТТИ ЮФУ, 2008. – C. 90-100.
Abstract:	Работа посвящена одной из актуальных проблем автоматического реферирования – составлению обзорных рефератов по набору документов. Рассмотрен новый на сегодняшний день алгоритм ранжирования связных структур (Manifold Ranking Algorithm) применительно к автоматическому реферированию новостных сюжетов. Алгоритм позволяет учитывать как зависимости между предложениями внутри одного документа, так и зависимости между всеми предложениями коллекции. Проведен анализ возможности использования алгоритма для русского языка. Построена пробная система автоматического реферирования. Приведены результаты работы системы. Сформулированы основные проблемы реализации системы и возможные методы их решения. Оценка качества работы системы произведена при помощи критерия ROUGE. Произведено сравнение результатов работы построенной системы с результатами в DUC 2003, DUC 2005. This work deals with one of the topical problems of automatic summarization – multi-document summarization in respect to news stories. This paper presents a novel extractive approach based on manifold-ranking of sentences to this summarization task. The manifold-ranking algorithm differentiates the intra-document and inter-document links between sentences with different weights. The possibility of the use the algorithm for Russian language is analyzed. A sample system for automatic summarization is build. This paper represents the sample summaries and describes experiments of summarization evaluation. The main problems of implementation of the system and possible methods of their solutions are formulated. The ROUGE criteria was used for evaluation. The results of work of built system are compared with the results of DUC 2003, DUC 2005.
URI:	http://elar.urfu.ru/handle/10995/2066
Conference name:	Вторая Российская конференция молодых ученых по информационному поиску (RuSSIR'2008)
Conference date:	1.09.2008-5.09.2008
RSCI ID:	978-5-8327-0295-7
Origin:	RuSSIR 2008
Appears in Collections:	Информационный поиск

Files in This Item:

File	Description	Size	Format
RuSSIR_2008_09.pdf		167,83 kB	Adobe PDF	View/Open

Show full item record Google Scholar