Please use this identifier to cite or link to this item: http://elar.urfu.ru/handle/10995/1330
Title: Автоматическая структуризация и анализ поискового поведения по логу поисковой машины
Other Titles: Automatic structuring and analysis of Web searcher behavior
Authors: Бузикашвили, Н.
Issue Date: 2007
Publisher: Изд-во Урал. ун-та
Citation: Бузикашвили, Н. Автоматическая структуризация и анализ поискового поведения по логу поисковой машины / Н. Бузикашвили // Интернет-математика 2007 : сб. работ участников конкурса науч. проектов по информ. поиску / [отв. ред. П. И. Браславский]. — Екатеринбург : Изд-во Урал. ун-та, 2007. — С. 25–36.
Abstract: Работа основана на разделении логической структуры поиска, описывающей взаимозависимости запросов пользователя, и ее физической реализации. Помимо линейных зависимостей, логическая структура поиска допускает ветвления и склейки, а физическая реализация — еще и окказиональные нарушения линейности. Показано, что обе нелинейных структуры присутствуют в поисковом поведении (поток запросов лучше интерпретируется в терминах нелинейного поиска). При этом, (1) доля запросов, за которыми следует ветвление поиска, составляет порядка 5%, (2) число ветвей в среднем чуть больше двух, (3) доля запросов, соответствующих склейке поисковых цепочек, составляет порядка 3%, (4) слиянию часто предшествует ветвление, т.е. имеет место схождение ранее разветвившегося поиска, (5) длина сливаемых цепочек (в том числе, при слиянии ранее после ветвления) устойчиво мала (порядка двух модификаций запроса), тогда как (6) при ветвлении без последующего слияния последняя ветвь может быть длинной, (7) запрос-композиция далее уже почти никогда не модифицируется, он финальный. Кроме того, рассмотрено использование операций генерализации и конкретизации запроса, понимаемых как вхождение одного запроса в другой. Оказалось, что (8) конкретизация (наращивание запроса) используется примерно в 4 раза чаще генерализации (укорачивания) при линейной модификации и ветвлении, а при слиянии — в 20 раз чаще. (9) доля запросов-композиций, являющихся точным объединением сливаемых, составляет более 10% таких запросов.
The study bases on the concept of non-linear logical search structure and different physical realizations of this structure in the search process. Non-linear dependencies among queries submitted by a searcher during temporal sessions are common. The findings of the study are: (1) a searcher frequently use branching search (a number of branching queries is about 5%); (2) a number of branches is a little bigger than two, (3) a number of convergent queries is about 3%; (4) the same search process frequently combines branching and convergence; (5) convergent query chains are small; (6) branching (non-convergent) chains are longer, (7) a convergent query is not modified later. A fraction of generalized (by exclusion of terms) queries and a fraction of narrowed (by addition of terms) queries are considered. (8) The ratio of narrowed and generalized queries is equal to 4:1 for linear query modification and branching whilst the ration is equal to 20:1 for convergent queries. (9) A fraction of convergent queries which are precise unions of combined queries is bigger than 10% of all convergent queries.
Keywords: ИНФОРМАЦИОННЫЙ ПОИСК В ИНТЕРНЕТЕ
ПОИСК ИНФОРМАЦИИИ В ИНТЕРНЕТЕ
СБОРНИКИ СТАТЕЙ
URI: http://elar.urfu.ru/handle/10995/1330
ISBN: 978-5-7525-1788-5
Origin: Интернет-математика 2007. — Екатеринбург, 2007
Appears in Collections:Информационный поиск

Files in This Item:
File Description SizeFormat 
IMAT_2007_04.pdf305,85 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.