Извлечение значимой информации из web-страниц для задач информационного поиска

Агеев, М. С.; Вершинников, И. В.; Добров, Б. В.

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/1414

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.author	Агеев, М. С.	ru
dc.contributor.author	Вершинников, И. В.	ru
dc.contributor.author	Добров, Б. В.	ru
dc.date.accessioned	2008-11-21T04:53:31Z	-
dc.date.available	2008-11-21T04:53:31Z	-
dc.date.issued	2005	-
dc.identifier.citation	Агеев М.С. Извлечение значимой информации из web-страниц для задач информационного поиска / М. С. Агеев, И. В. Вершинников, Б. В. Добров // Интернет-математика 2005. Автоматическая обработка веб-данных. - М., 2005. - С. 283-301.	ru
dc.identifier.uri	http://elar.urfu.ru/handle/10995/1414	-
dc.description.abstract	В статье описываются разработанные нами методы разделения web-страниц на содержательную и навигационную части. Данные методы основаны на выделении одинаковых частей страниц с одного сайта. Основной целью данной работы является повышение качества информационного поиска за счет удаления навигационной части из web-страниц. Мы покажем, что разработанный алгоритм позволяет эффективно разделять страницы на содержательную и навигационную части. С другой стороны, проведенный нами эксперимент по анализу эффективности информационного поиска в web на основе коллекции РОМИП-WEB-narod.ru с использованием разработанного алгоритма не привел к улучшению средней оценки точности поиска. В статье описан детальный анализ результатов информационного поиска с использованием описанного алгоритма.	ru
dc.description.abstract	We describe a new algorithm for automatic partition of web page onto navigational and main parts. The algorithm is based on extraction of common parts in web-pages from one web-site. Our basic supposition is that we can improve quality of information retrieval system by purging navigational part of web-pages. We show that our method successfully extract navigational and main parts from web-pages. On the other hand, cutting of navigational part do not improve quality of web information retrieval.	ru
dc.format.extent	842144 bytes	en
dc.format.mimetype	application/pdf	en
dc.language.iso	ru	en
dc.publisher	б. и.	ru
dc.relation.ispartof	Интернет-математика 2005: автоматическая обработка веб-данных. — М., 2005	ru
dc.title	Извлечение значимой информации из web-страниц для задач информационного поиска	ru
dc.title.alternative	Automatic Extraction of Significant Part of Web Pages for Informational Retrieval	en
dc.type	Article	en
dc.type	info:eu-repo/semantics/article	en
dc.type	info:eu-repo/semantics/publishedVersion	en
Располагается в коллекциях:	Информационный поиск

Файлы этого ресурса:

Файл	Описание	Размер	Формат
IMAT_2005_15.pdf		822,41 kB	Adobe PDF	Просмотреть/Открыть

Показать базовое описание ресурса Статистика Google Scholar

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.