Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/1339
Название: Автоматическое разрешение лексической многозначности на базе тезаурусных знаний
Другие названия: Thesaurus-based word sense disambiguation
Авторы: Лукашевич, Н. В.
Чуйко, Д. С.
Дата публикации: 2007
Издатель: Изд-во Урал. ун-та
Библиографическое описание: Лукашевич, Н. В. Автоматическое разрешение лексической многозначности на базе тезаурусных знаний / Н. В. Лукашевич, Д. С. Чуйко // Интернет-математика 2007 : сб. работ участников конкурса науч. проектов по информ. поиску / [отв. ред. П. И. Браславский]. — Екатеринбург : Изд-во Урал. ун-та, 2007. — С. 108–117.
Аннотация: В данной работе мы описываем новый алгоритм для разрешения лексической многозначности на основе Тезауруса русского языка РуТез. Мы оценили точность работы алгоритма для задачи «все слова текста» и задачи разрешения многозначности тематической лексики. Для задачи «все слова текста» точность применяемого метода сравнима с результатами лучших систем на специализированной конференции SENSEVAL-3, при этом мы не применяем семантически размеченные корпуса, которые используются такими системами. Однако полученная точность разрешения многозначности для всех слов текста недостаточна для применения в задачах информационного поиска. Результаты, полученные при разрешении многозначности тематической лексики, значительно выше. Поэтому представляется перспективной разработка гибридных методов информационного поиска, сочетающих пословные методы и методы, основанные на использовании тезаурусных и онтологических ресурсов для конкретных предметных областей.
In the paper we describe a new method for word-sense disambiguation based on the Thesaurus of Russian Language RuThes. We evaluated precision of the algorithm for the «all- words» task and the task of thematic-oriented word-sense disambiguation. For the «all-words» task the precision of our algorithm, which does not use sense-tagged corpora, is comparable with the results of the best systems of the specialized conference SENSEVAL-3. However the level of the precision for the «all-words» task is not enough for the use in information-retrieval applications. For the task of thematic-oriented word-sense disambiguation the precision is much higher. Therefore it could be perspective to develop hybrid information -retrieval methods combining word-based techniques for all words and concept-based techniques for processing of thematic words and terms based on domain- specific thesauri or ontologies.
Ключевые слова: ИНФОРМАЦИОННЫЙ ПОИСК В ИНТЕРНЕТЕ
ПОИСК ИНФОРМАЦИИИ В ИНТЕРНЕТЕ
СБОРНИКИ СТАТЕЙ
URI: http://elar.urfu.ru/handle/10995/1339
ISBN: 978-5-7525-1788-5
Источники: Интернет-математика 2007. — Екатеринбург, 2007
Располагается в коллекциях:Информационный поиск

Файлы этого ресурса:
Файл Описание РазмерФормат 
IMAT_2007_13.pdf241,33 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.