Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://elar.urfu.ru/handle/10995/1421
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.author | Киселев, М. В. | ru |
dc.contributor.author | Пивоваров, В. С. | ru |
dc.contributor.author | Шмулевич, М. М. | ru |
dc.date.accessioned | 2008-11-21T05:51:31Z | - |
dc.date.available | 2008-11-21T05:51:31Z | - |
dc.date.issued | 2005 | - |
dc.identifier.citation | Киселев М. В. Метод кластеризации текстов, учитывающий совместную встречаемость ключевых терминов, и его применение к анализу тематической структуры новостного потока, а также ее динамики / М. В. Киселев, В. С. Пивоваров, М. М. Шмулевич // Интернет-математика 2005. Автоматическая обработка веб-данных. - М., 2005. - С. 412-435. | ru |
dc.identifier.uri | http://elar.urfu.ru/handle/10995/1421 | - |
dc.description.abstract | Данная работа посвящена автоматической смысловой кластеризации текстов и ее применению к анализу динамики тематического состава потока новостей. Проанализированы существующие методики кластеризации, и показано, что ни одна из них не обладает полным набором качеств, необходимых для успешного решения этой задачи. С целью преодоления этих трудностей предложен новый метод, названный островной кластеризацией, который основан на статистической мере корреляции встречаемости в текстах термов, характеризующихся значимым превышением их частот над средним уровнем. Показано, что он успешно решает проблемы плоской и иерархической кластеризации новостей, а также отслеживания динамики тем новостного потока. | ru |
dc.description.abstract | This paper is devoted to automated clustering of document sets and its application to analysis of electronic news topic structure dynamics. The existing clustering algorithms are considered and it is shown that none of them obeys the full set of requirements necessary for successful solution of this problem. In order to overcome these difficulties a novel method called island clustering is proposed. It is based on a statistical measure of term co-occurrence calculated only for the terms showing in some texts significant frequency excess over the average level. It is demonstrated that our method obtains high quality flat and hierarchical clustering of news and allows user to monitor qualitatively and quantitatively evolution of the news stream thematic structure. | ru |
dc.format.extent | 576532 bytes | en |
dc.format.mimetype | application/pdf | en |
dc.language.iso | ru | en |
dc.publisher | б. и. | ru |
dc.relation.ispartof | Интернет-математика 2005: автоматическая обработка веб-данных. — М., 2005 | ru |
dc.title | Метод кластеризации текстов, учитывающий совместную встречаемость ключевых терминов, и его применение к анализу тематической структуры новостного потока, а также ее динамики | ru |
dc.type | Article | en |
dc.type | info:eu-repo/semantics/article | en |
dc.type | info:eu-repo/semantics/publishedVersion | en |
Располагается в коллекциях: | Информационный поиск |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
IMAT_2005_22.pdf | 563,02 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.