Сравнение эффективности двух методик снятия лексической и морфологической неоднозначности для русского языка (скрытая модель Маркова и синтаксический анализатор именных групп)

Сокирко, А. В.; Толдова, С. Ю.

Please use this identifier to cite or link to this item: http://elar.urfu.ru/handle/10995/1391

Full metadata record

DC Field	Value	Language
dc.contributor.author	Сокирко, А. В.	ru
dc.contributor.author	Толдова, С. Ю.	ru
dc.date.accessioned	2008-11-20T11:08:02Z	-
dc.date.available	2008-11-20T11:08:02Z	-
dc.date.issued	2005	-
dc.identifier.citation	Сокирко А. В. Сравнение эффективности двух методик снятия лексической и морфологической неоднозначности для русского языка (скрытая модель Маркова и синтаксический анализатор именных групп) / А. В. Сокирко, С. Ю. Толдова // Интернет-математика 2005. Автоматическая обработка веб-данных. - М., 2005. - С. 80-94.	ru
dc.identifier.uri	http://elar.urfu.ru/handle/10995/1391	-
dc.description.abstract	В работе описывается серия экспериментов по снятию морфологической и лексической (лемматической) неоднозначности с использованием скрытых моделей Маркова. Для обучения модели используется Национальный корпус русского языка. Проводятся сравнения модели Маркова с программой, построенной на правилах, составленных вручную и с моделями, построенными на других формализмах (вероятностных или гибридных). Авторы приходят к выводу о перспективности использования скрытых моделей Маркова для разрешения морфологической неоднозначности. Вместе с тем точность снятия лексической неоднозначности, с которой работает модель Маркова, ниже, чем у других вероятностных моделей.	ru
dc.description.abstract	A set of experiments to resolve lexical and morphological ambiguity in Russian using Hidden Markov Model(HMM) is described. The HMM-tagger is trained by Russian National Corpus. Three different tag sets are used. The authors compare the HMMtagger with a rule-based shallow syntax program (Synan) and also with some other taggers (stochastic or hybrid). The experiments show that that for the same amount of remaining morphological ambiguity, the error rate of the HMM-tagger is almost the same as of Synan program, but if the output morphological interpretation should be unambiguous, then the HMM-tagger is considerably better. Nevertheless while resolving lexical ambiguity the proposed HMMtagger yields less accurate results, than the programs which are on other stochastic models.	ru
dc.format.extent	293182 bytes	en
dc.format.mimetype	application/pdf	en
dc.language.iso	ru	en
dc.publisher	б. и.	ru
dc.relation.ispartof	Интернет-математика 2005: автоматическая обработка веб-данных. — М., 2005	ru
dc.title	Сравнение эффективности двух методик снятия лексической и морфологической неоднозначности для русского языка (скрытая модель Маркова и синтаксический анализатор именных групп)	ru
dc.title.alternative	Comparing a stochastic tagger based on Hidden Markov Model with a rule-based tagger for Russian	en
dc.type	Article	en
dc.type	info:eu-repo/semantics/article	en
dc.type	info:eu-repo/semantics/publishedVersion	en
Appears in Collections:	Информационный поиск

Files in This Item:

File	Description	Size	Format
IMAT_2005_05.pdf		286,31 kB	Adobe PDF	View/Open

Show simple item record Google Scholar