Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://elar.urfu.ru/handle/10995/1392
Название: | Поисковое поведение пользователя Яndexа (анализ веблогов) |
Другие названия: | The Yandex Study Technical Report: First Findings |
Авторы: | Бузикашвили, Н. |
Дата публикации: | 2005 |
Издатель: | б. и. |
Библиографическое описание: | Бузикашвили Н. Поисковое поведение пользователя Яndexа (анализ веблогов) / Н. Бузикашвили // Интернет-математика 2005. Автоматическая обработка веб-данных. - М., 2005. - С. 95-120. |
Аннотация: | Изложены теоретические предпосылки, цели и результаты первого этапа анализа логов Яndexа. Введены понятия логической структуры и пространства физической реализации поиска. Рассмотрены типы отображений (реализаций) логической структуры и разные типы сессий как проекции реализации на подпространства пространства реализации. Высказано предположение об ограничениях на реализацию, вытекающих из ограниченности кратковременной памяти. Построена процедура автоматического выявления логических сессий и проверены гипотезы об их чередовании. Показано, что чередование с возвратом к прерванной сессии редко, а встречаясь, обычно имеет форму одноуровневой вложенности одной логической сессии в другую. Кроме того, получены стандартные характеристики поискового поведения пользователя русскоязычного Веба. Дальнейшая работа: (а) построение формального языка описания поискового поведения и автоматическая трансляция в него логов; (б) автоматический анализ и выделение закономерностей в полученных описаниях. The theoretical background, goals and first findings of the Yandex TL study are described. The background includes: a logical structure of search process, a space of physical search realizations, mapping of the logical structure onto the space of realizations, different types of sessions as projections of the search process in the physical search space onto subspaces of this space. Also a hypothesis of different short-term memory based restrictions of different physical realizations is formulated. The term- and string-based queries similarity is introduced, and transitive closure of this relation is considered as a logical session. It is shown that switching with return to unfinished session (a) is very rare and (b) it formed as time inclusion of the second session, i.e. a searcher returns to the broken session only when he finishes a new session. The Yandex study is the first TLA of Russian-language search engine and the standard quantitative characteristics of user searching behavior are calculated. The further works: (a) design and implementation of the ‘Bates-Fidel language’ language and automatic translation of the transaction logs into this language, (b) automatic analysis of these descriptions and extraction of regularities. |
URI: | http://elar.urfu.ru/handle/10995/1392 |
Источники: | Интернет-математика 2005: автоматическая обработка веб-данных. — М., 2005 |
Располагается в коллекциях: | Информационный поиск |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
IMAT_2005_06.pdf | 505,96 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.