Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://elar.urfu.ru/handle/10995/1414
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.author | Агеев, М. С. | ru |
dc.contributor.author | Вершинников, И. В. | ru |
dc.contributor.author | Добров, Б. В. | ru |
dc.date.accessioned | 2008-11-21T04:53:31Z | - |
dc.date.available | 2008-11-21T04:53:31Z | - |
dc.date.issued | 2005 | - |
dc.identifier.citation | Агеев М.С. Извлечение значимой информации из web-страниц для задач информационного поиска / М. С. Агеев, И. В. Вершинников, Б. В. Добров // Интернет-математика 2005. Автоматическая обработка веб-данных. - М., 2005. - С. 283-301. | ru |
dc.identifier.uri | http://elar.urfu.ru/handle/10995/1414 | - |
dc.description.abstract | В статье описываются разработанные нами методы разделения web-страниц на содержательную и навигационную части. Данные методы основаны на выделении одинаковых частей страниц с одного сайта. Основной целью данной работы является повышение качества информационного поиска за счет удаления навигационной части из web-страниц. Мы покажем, что разработанный алгоритм позволяет эффективно разделять страницы на содержательную и навигационную части. С другой стороны, проведенный нами эксперимент по анализу эффективности информационного поиска в web на основе коллекции РОМИП-WEB-narod.ru с использованием разработанного алгоритма не привел к улучшению средней оценки точности поиска. В статье описан детальный анализ результатов информационного поиска с использованием описанного алгоритма. | ru |
dc.description.abstract | We describe a new algorithm for automatic partition of web page onto navigational and main parts. The algorithm is based on extraction of common parts in web-pages from one web-site. Our basic supposition is that we can improve quality of information retrieval system by purging navigational part of web-pages. We show that our method successfully extract navigational and main parts from web-pages. On the other hand, cutting of navigational part do not improve quality of web information retrieval. | ru |
dc.format.extent | 842144 bytes | en |
dc.format.mimetype | application/pdf | en |
dc.language.iso | ru | en |
dc.publisher | б. и. | ru |
dc.relation.ispartof | Интернет-математика 2005: автоматическая обработка веб-данных. — М., 2005 | ru |
dc.title | Извлечение значимой информации из web-страниц для задач информационного поиска | ru |
dc.title.alternative | Automatic Extraction of Significant Part of Web Pages for Informational Retrieval | en |
dc.type | Article | en |
dc.type | info:eu-repo/semantics/article | en |
dc.type | info:eu-repo/semantics/publishedVersion | en |
Располагается в коллекциях: | Информационный поиск |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
IMAT_2005_15.pdf | 822,41 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.