Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://elar.urfu.ru/handle/10995/1417
Название: | Оптимизация процедуры автоматического пополнения веб-каталога |
Авторы: | Киселев, М. В. |
Дата публикации: | 2005 |
Издатель: | б. и. |
Библиографическое описание: | Киселев М. В. Оптимизация процедуры автоматического пополнения веб-каталога / М. В. Киселев // Интернет-математика 2005. Автоматическая обработка веб-данных. - М., 2005. - С. 342-363. |
Аннотация: | В работе изучается влияние применения различных методов классификации текстов на точность автоматического пополнения веб-каталогов [4, 5, 11]. В процессе исследования была выработана стратегия проведения экспериментов, направленных на определение оптимальной классификационной процедуры, а также сформулированы новые методические рекомендации по построению и оценке точности иерархического классификатора. На основе экспериментов с выборкой из содержимого веб-каталога Яндекс была доказана оправданность этих рекомендаций и определены оптимальные с точки зрения точности алгоритмы классификации и формирования векторов признаков, оказавшиеся разными для разных уровней дерева каталога. The influence of application of different text classification methods on accuracy of automated distribution of internet pages in the thematic web directory nodes [4, 5, 11] has been explored. An experiment strategy aimed at determination of the optimal classification procedure has been designed. New methodological recommendations for creation and accuracy evaluation of hierarchical classifiers have been proposed. On the basis of the experiments performed on a sampled Yandex web directory con-tents the validity of these recommendations have been proved and the optimal (in terms of accuracy) algorithms for classification and feature vector formation have been determined. It was found that the sets of these algorithms differ for the different web directory levels. |
Ключевые слова: | КЛАССИФИКАЦИЯ ТЕКСТОВ ИЕРАРХИЧЕСКАЯ КЛАССИФИКАЦИЯ АВТОМАТИЧЕСКОЕ ПОПОЛНЕНИЕ ВЕБ-КАТАЛОГОВ TEXT MINING TEXT CLASSIFICATION HIERARCHICAL CLASSIFIERS AUTOMATED WEB DIRECTORY POPULATING |
URI: | http://elar.urfu.ru/handle/10995/1417 |
Источники: | Интернет-математика 2005: автоматическая обработка веб-данных. — М., 2005 |
Располагается в коллекциях: | Информационный поиск |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
IMAT_2005_18.pdf | 396,07 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.