Please use this identifier to cite or link to this item: http://elar.urfu.ru/handle/10995/1413
Title: Оптимизация расчета ссылочной популярности и учета ее при ранжировании результатов поиска
Other Titles: Optimization of link popularity determination and its application in search results ranking
Authors: Трофименко, Е. А.
Issue Date: 2005
Publisher: б. и.
Citation: Трофименко Е. А. Оптимизация расчета ссылочной популярности и учета ее при ранжировании результатов поиска / Е. А. Трофименко // Интернет-математика 2005. Автоматическая обработка веб-данных. - М., 2005. - С. 272-282.
Abstract: Проблема поисковых алгоритмов, учитывающих наличие внешних ссылок на документ или сайт, состоит в возможности искусственного увеличения ссылочной популярности путем обмена ссылками, участия в ссылочных фермах. Для решения проблемы накруток обычно используют индивидуальные меры: исключение сайтов и ферм из индекса, наложение фильтров на исходящие ссылки и т.п., что требует участия человека-модератора. Кроме того, масса промежуточных случаев (тематические кольца, обмен ссылками в узких темах), могут быть ошибочно отнесены в категорию накрутчиков. В работе предложена идея по разделению индекса ссылочной популярности (PageRank, SiteRank) на независимые части, соответствующие «добровольной» и «обменной» цитируемости с тем, чтобы в алгоритме ранжирования учитывать их с разными весами. Предложенный подход позволяет количественно и алгоритмически определять степень вовлеченности в системы ссылочной накрутки.
Search engine ranking algorithms which use inbound links to documents, may be influenced by creation of artificial links and raising link popularity with links exchange, link farms etc. To solve this problem some non-algorithmic methods are used: ban of some web sites or whole link farms, filtering of outbound links, which require human moderator to revise all these sites. Additionally, there are lot of intermediate cases between fair and unfair use of links exchange (web rings, small groups of linked thematic web sites), which may cause mistakes. The suggested idea consists in dividing of common PagePank (SiteRank) into two parts: “fair rank” (including only one-side links) and “exchange rank” (including only links exchange) for further use them in ranking algorithm with different weights. The approach allows to quantitatively determine a rate of artificially raised rank.
URI: http://elar.urfu.ru/handle/10995/1413
Origin: Интернет-математика 2005: автоматическая обработка веб-данных. — М., 2005
Appears in Collections:Информационный поиск

Files in This Item:
File Description SizeFormat 
IMAT_2005_14.pdf387,25 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.