Please use this identifier to cite or link to this item: http://hdl.handle.net/10995/1416
Title: Структура русскоязычной части глубинного Веба
Other Titles: Characterization of Russian Deep Web
Authors: Шестаков, Д.
Воронцова, Н.
Issue Date: 2005
Publisher: б. и.
Citation: Шестаков Д. Структура русскоязычной части глубинного Веба / Д. Шестаков, Н. Воронцова // Интернет-математика 2005. Автоматическая обработка веб-данных. - М., 2005. - С. 320-341.
Abstract: Значительная часть Веба, «скрытая» за поисковыми веб-формами, не индексируется современными поисковыми системами. «Скрытая» часть Веба известна под названием глубинный Веб. Веб-страницы в глубинном Вебе являются динамическими и представляют собой результаты, возвращаемые поисковыми веб-формами. В нашей работе, мы изучали русскоязычную часть глубинного Веба (RDW). Основной целью было определение числа глубинных сайтов, расположенных в RDW. Данное исследование является первой работой, которая рассматривает определенную часть глубинного Веба, представляющую интерес носителям какого-то одного (не английского) языка.
The significant portion of the Web is hidden behind search forms and not indexed by conventional search engines. This part of the Web is known as the deep Web. Pages in the deep Web are dynamically generated in response to queries submitted via search forms. In this work, we studied the Russian part of deep Web. Our main goal was to estimate the number of deep Web sites in the Russian deep Web. The presented study is a first work devoted to the certain part of deep Web, which is formed on the basis of some particular language usage.
Keywords: ГЛУБИННЫЙ ВЕБ
РУССКОЯЗЫЧНЫЙ ВЕБ
СЛУЧАЙНАЯ ВЫБОРКА IP-АДРЕСОВ
DEEP WEB
WEB DATABASES
NATIONAL WEB
WEB CHARACTERIZATION
RANDOM SAMPLING
URI: http://hdl.handle.net/10995/1416
http://elar.urfu.ru/handle/10995/1416
Origin: Интернет-математика 2005: автоматическая обработка веб-данных. — М., 2005
Appears in Collections:Информационный поиск

Files in This Item:
File Description SizeFormat 
IMAT_2005_17.pdf522,88 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.