Please use this identifier to cite or link to this item:
http://elar.urfu.ru/handle/10995/1339
Title: | Автоматическое разрешение лексической многозначности на базе тезаурусных знаний |
Other Titles: | Thesaurus-based word sense disambiguation |
Authors: | Лукашевич, Н. В. Чуйко, Д. С. |
Issue Date: | 2007 |
Publisher: | Изд-во Урал. ун-та |
Citation: | Лукашевич, Н. В. Автоматическое разрешение лексической многозначности на базе тезаурусных знаний / Н. В. Лукашевич, Д. С. Чуйко // Интернет-математика 2007 : сб. работ участников конкурса науч. проектов по информ. поиску / [отв. ред. П. И. Браславский]. — Екатеринбург : Изд-во Урал. ун-та, 2007. — С. 108–117. |
Abstract: | В данной работе мы описываем новый алгоритм для разрешения лексической многозначности на основе Тезауруса русского языка РуТез. Мы оценили точность работы алгоритма для задачи «все слова текста» и задачи разрешения многозначности тематической лексики. Для задачи «все слова текста» точность применяемого метода сравнима с результатами лучших систем на специализированной конференции SENSEVAL-3, при этом мы не применяем семантически размеченные корпуса, которые используются такими системами. Однако полученная точность разрешения многозначности для всех слов текста недостаточна для применения в задачах информационного поиска. Результаты, полученные при разрешении многозначности тематической лексики, значительно выше. Поэтому представляется перспективной разработка гибридных методов информационного поиска, сочетающих пословные методы и методы, основанные на использовании тезаурусных и онтологических ресурсов для конкретных предметных областей. In the paper we describe a new method for word-sense disambiguation based on the Thesaurus of Russian Language RuThes. We evaluated precision of the algorithm for the «all- words» task and the task of thematic-oriented word-sense disambiguation. For the «all-words» task the precision of our algorithm, which does not use sense-tagged corpora, is comparable with the results of the best systems of the specialized conference SENSEVAL-3. However the level of the precision for the «all-words» task is not enough for the use in information-retrieval applications. For the task of thematic-oriented word-sense disambiguation the precision is much higher. Therefore it could be perspective to develop hybrid information -retrieval methods combining word-based techniques for all words and concept-based techniques for processing of thematic words and terms based on domain- specific thesauri or ontologies. |
Keywords: | ИНФОРМАЦИОННЫЙ ПОИСК В ИНТЕРНЕТЕ ПОИСК ИНФОРМАЦИИИ В ИНТЕРНЕТЕ СБОРНИКИ СТАТЕЙ |
URI: | http://elar.urfu.ru/handle/10995/1339 |
ISBN: | 978-5-7525-1788-5 |
Origin: | Интернет-математика 2007. — Екатеринбург, 2007 |
Appears in Collections: | Информационный поиск |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
IMAT_2007_13.pdf | 241,33 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.