Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/1330
Название: Автоматическая структуризация и анализ поискового поведения по логу поисковой машины
Другие названия: Automatic structuring and analysis of Web searcher behavior
Авторы: Бузикашвили, Н.
Дата публикации: 2007
Издатель: Изд-во Урал. ун-та
Библиографическое описание: Бузикашвили, Н. Автоматическая структуризация и анализ поискового поведения по логу поисковой машины / Н. Бузикашвили // Интернет-математика 2007 : сб. работ участников конкурса науч. проектов по информ. поиску / [отв. ред. П. И. Браславский]. — Екатеринбург : Изд-во Урал. ун-та, 2007. — С. 25–36.
Аннотация: Работа основана на разделении логической структуры поиска, описывающей взаимозависимости запросов пользователя, и ее физической реализации. Помимо линейных зависимостей, логическая структура поиска допускает ветвления и склейки, а физическая реализация — еще и окказиональные нарушения линейности. Показано, что обе нелинейных структуры присутствуют в поисковом поведении (поток запросов лучше интерпретируется в терминах нелинейного поиска). При этом, (1) доля запросов, за которыми следует ветвление поиска, составляет порядка 5%, (2) число ветвей в среднем чуть больше двух, (3) доля запросов, соответствующих склейке поисковых цепочек, составляет порядка 3%, (4) слиянию часто предшествует ветвление, т.е. имеет место схождение ранее разветвившегося поиска, (5) длина сливаемых цепочек (в том числе, при слиянии ранее после ветвления) устойчиво мала (порядка двух модификаций запроса), тогда как (6) при ветвлении без последующего слияния последняя ветвь может быть длинной, (7) запрос-композиция далее уже почти никогда не модифицируется, он финальный. Кроме того, рассмотрено использование операций генерализации и конкретизации запроса, понимаемых как вхождение одного запроса в другой. Оказалось, что (8) конкретизация (наращивание запроса) используется примерно в 4 раза чаще генерализации (укорачивания) при линейной модификации и ветвлении, а при слиянии — в 20 раз чаще. (9) доля запросов-композиций, являющихся точным объединением сливаемых, составляет более 10% таких запросов.
The study bases on the concept of non-linear logical search structure and different physical realizations of this structure in the search process. Non-linear dependencies among queries submitted by a searcher during temporal sessions are common. The findings of the study are: (1) a searcher frequently use branching search (a number of branching queries is about 5%); (2) a number of branches is a little bigger than two, (3) a number of convergent queries is about 3%; (4) the same search process frequently combines branching and convergence; (5) convergent query chains are small; (6) branching (non-convergent) chains are longer, (7) a convergent query is not modified later. A fraction of generalized (by exclusion of terms) queries and a fraction of narrowed (by addition of terms) queries are considered. (8) The ratio of narrowed and generalized queries is equal to 4:1 for linear query modification and branching whilst the ration is equal to 20:1 for convergent queries. (9) A fraction of convergent queries which are precise unions of combined queries is bigger than 10% of all convergent queries.
Ключевые слова: ИНФОРМАЦИОННЫЙ ПОИСК В ИНТЕРНЕТЕ
ПОИСК ИНФОРМАЦИИИ В ИНТЕРНЕТЕ
СБОРНИКИ СТАТЕЙ
URI: http://elar.urfu.ru/handle/10995/1330
ISBN: 978-5-7525-1788-5
Источники: Интернет-математика 2007. — Екатеринбург, 2007
Располагается в коллекциях:Информационный поиск

Файлы этого ресурса:
Файл Описание РазмерФормат 
IMAT_2007_04.pdf305,85 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.