Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/10995/3058
Название: Could we automatically reproduce semantic relations of an information retrieval thesaurus?
Авторы: Panchenko, A.
Дата публикации: 2010
Издатель: Издательско-полиграфический центр Воронежского государственного университета
Библиографическое описание: Panchenko, A. Could we automatically reproduce semantic relations of an information retrieval thesaurus? / A. Panchenko // IV Российская летняя школа по информационному поиску RuSSIR’2010, 13-18 сентября 2010 г. : труды Четвертой Российской конференции молодых ученых по информационному поиску. — Воронеж : Издательско-полиграфический центр Воронежского государственного университета, 2010. — С. 36-51.
Аннотация: A well constructed thesaurus is recognized as a valuable source of semantic information for various applications, especially for Information Retrieval. The main hindrances to using thesaurus-oriented approaches are the high complexity and cost of manual thesauri creation. This paper addresses the problem of automatic thesaurus construction, namely we study the quality of automatically extracted semantic relations as compared with the semantic relations of a manually crafted thesaurus. The vector-space model based on syntactic contexts was used to reproduce relations between the terms of a manually constructed thesaurus. We propose a simple algorithm for representing both single word and multiword terms in the distributional space of syntactic contexts. Furthermore, we propose a method for evaluation quality of the extracted relations. Our experiments show significant difference between the automatically and manually constructed relations: while many of the automatically generated relations are relevant, just a small part of them could be found in the original thesaurus.
Ключевые слова: THESAURUS
SEMANTIC RELATIONS
VECTOR-SPACE MODEL
DISTRIBUTIONAL ANALYSIS
MULTIWORD EXPRESSIONS
URI: http://hdl.handle.net/10995/3058
http://elar.urfu.ru/handle/10995/3058
Источники: IV Российская летняя школа по информационному поиску RuSSIR’2010, 13-18 сентября 2010 г. : труды Четвертой Российской конференции молодых ученых по информационному поиску
Располагается в коллекциях:Информационный поиск

Файлы этого ресурса:
Файл Описание РазмерФормат 
russir-2010-04.pdf1,57 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.