Please use this identifier to cite or link to this item: http://hdl.handle.net/10995/1392
Title: Поисковое поведение пользователя Яndexа (анализ веблогов)
Other Titles: The Yandex Study Technical Report: First Findings
Authors: Бузикашвили, Н.
Issue Date: 2005
Publisher: б. и.
Citation: Бузикашвили Н. Поисковое поведение пользователя Яndexа (анализ веблогов) / Н. Бузикашвили // Интернет-математика 2005. Автоматическая обработка веб-данных. - М., 2005. - С. 95-120.
Abstract: Изложены теоретические предпосылки, цели и результаты первого этапа анализа логов Яndexа. Введены понятия логической структуры и пространства физической реализации поиска. Рассмотрены типы отображений (реализаций) логической структуры и разные типы сессий как проекции реализации на подпространства пространства реализации. Высказано предположение об ограничениях на реализацию, вытекающих из ограниченности кратковременной памяти. Построена процедура автоматического выявления логических сессий и проверены гипотезы об их чередовании. Показано, что чередование с возвратом к прерванной сессии редко, а встречаясь, обычно имеет форму одноуровневой вложенности одной логической сессии в другую. Кроме того, получены стандартные характеристики поискового поведения пользователя русскоязычного Веба. Дальнейшая работа: (а) построение формального языка описания поискового поведения и автоматическая трансляция в него логов; (б) автоматический анализ и выделение закономерностей в полученных описаниях.
The theoretical background, goals and first findings of the Yandex TL study are described. The background includes: a logical structure of search process, a space of physical search realizations, mapping of the logical structure onto the space of realizations, different types of sessions as projections of the search process in the physical search space onto subspaces of this space. Also a hypothesis of different short-term memory based restrictions of different physical realizations is formulated. The term- and string-based queries similarity is introduced, and transitive closure of this relation is considered as a logical session. It is shown that switching with return to unfinished session (a) is very rare and (b) it formed as time inclusion of the second session, i.e. a searcher returns to the broken session only when he finishes a new session. The Yandex study is the first TLA of Russian-language search engine and the standard quantitative characteristics of user searching behavior are calculated. The further works: (a) design and implementation of the ‘Bates-Fidel language’ language and automatic translation of the transaction logs into this language, (b) automatic analysis of these descriptions and extraction of regularities.
URI: http://hdl.handle.net/10995/1392
http://elar.urfu.ru/handle/10995/1392
Origin: Интернет-математика 2005: автоматическая обработка веб-данных. — М., 2005
Appears in Collections:Информационный поиск

Files in This Item:
File Description SizeFormat 
IMAT_2005_06.pdf505,96 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.