Please use this identifier to cite or link to this item: http://hdl.handle.net/10995/1349
Title: Организация поиска в текстовых коллекциях на русском языке XVIII в.
Other Titles: Search in Russian text collections of the XVIII century
Authors: Соловьев, В. Д.
Маргулис, И. С.
Issue Date: 2007
Publisher: Изд-во Урал. ун-та
Citation: Соловьев, В. Д. Организация поиска в текстовых коллекциях на русском языке XVIII века / В. Д. Соловьев, И. С. Маргулис // Интернет-математика 2007 : сб. работ участников конкурса науч. проектов по информ. поиску / [отв. ред. П. И. Браславский]. — Екатеринбург : Изд-во Урал. ун-та, 2007. — С. 191–199.
Abstract: Исследование старорусских текстов существенно облегчается при использовании их электронных версий. Материалы становятся доступными для исследователей не только из крупных университетских центров. Оцифровка старинных текстов ведется крупнейшими библиотеками Мира, в том числе Российской государственной библиотекой. Актуальность и различные аспекты проблемы оцифровки недавно были подробно обсуждены в [41]. Исследование старорусских текстов в первую очередь требует разработки морфологических анализаторов и создания поисковых программ, ориентированных на словоизменение в старорусском языке. Для решения проблемы наиболее перспективной выглядит идея адаптации современных алгоритмов морфологического анализа и поиска к старорусскому языку с использованием электронного словаря XVIII в. В ходе выполнения проекта впервые созданы прямой и обратный электронные словари XVIII века. Разработана программа для локального поиска слов в старинной орфографии с учетом словоизменения для русского языка XVIII в. Программа представляет собой инсталлируемую надстройку для MS Word.
The investigation of Old-Russian texts becomes much easier with the use of their digital versions as the materials are acceptable not only for researches from big university centers. Digital versions of old texts are created by the biggest libraries of the world including the Russian State Library. The necessity and different aspects of digitization of old writing were analyzed in detail in the work: Solovyev V. Electronic Library of Russian Books of the XVIII Century: Problems and Perspectives. Proc. International conf. London-EVA’05. London. 2005. First of all the investigation of Old-Russian texts requires the development of morphological analyzers and search programs, oriented to word-changing in the Old Russian language. It looks much more promising to adapt contemporary algorithms of morphological analysis and search for the Old Russian language, using electronic dictionary of the XVIII century for solving the problem. The direct and reversed electronic dictionaries of the XVIII century were compiled during the project implementation for the first time. We developed the program for local search of words of ancient spelling taking into account word-changes for the Russian language of the XVIII century. The program is an installed extension for MS Word. We have been working on text corpuses of the XVIII century, in which the results of the work may be used. The research is supported by RFBR and RFH.
Keywords: ИНФОРМАЦИОННЫЙ ПОИСК В ИНТЕРНЕТЕ
ПОИСК ИНФОРМАЦИИИ В ИНТЕРНЕТЕ
СБОРНИКИ СТАТЕЙ
URI: http://hdl.handle.net/10995/1349
http://elar.urfu.ru/handle/10995/1349
ISBN: 978-5-7525-1788-5
Origin: Интернет-математика 2007. — Екатеринбург, 2007
Appears in Collections:Информационный поиск

Files in This Item:
File Description SizeFormat 
IMAT_2007_22.pdf325,79 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.