Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://elar.urfu.ru/handle/10995/3707
Название: | Information Retrieval System for News Articles in Russian |
Авторы: | Zharikov, A. Kristalovsky, K. Pivovarov, V. |
Дата публикации: | 2011 |
Издатель: | St. Petersburg University Press |
Библиографическое описание: | Zharikov A. Information Retrieval System for News Articles in Russian / A. Zharikov, K. Kristalovsky, V. Pivovarov // Web of Data: The joint RuSSIR/EDBT 2011 Summer School, August 15–19, 2011, Proceedings of the Fifth Russian Young Scientists Conference in Information Retrieval / B. Novikov, P. Braslavsky (Eds.). — St. Petersburg, 2011 — P. 5-14. |
Аннотация: | We present a description of the natural language processing system developed for information retrieval project scan.interfax.ru. The system should process news articles in Russian and retrieve as much information as possible about persons, organizations or other text objects mentioned there. The conceptual system idea is to process and “understand” documents without using any time dependent named object databases. The system should retrieve and interpret person names, organizations, geography and some other text structures. And only on the second stage — to make identification of retrieved named objects via database. The resulting information is used in Scan project to allow complex-query search of news articles, to fill a named object database in automatic manner and to provide information for analytical services. We discuss functionality of the system, main approach ideas used and challenges to be resolved in future work. The article mostly covers entity extraction procedure and fact extraction mechanics. The problems of geography entity extraction are discussed particularly. |
Ключевые слова: | COMPUTATIONAL LINGUISTICS NATURAL LANGUAGE PROCESSING INFORMATION RETRIEVAL |
URI: | http://elar.urfu.ru/handle/10995/3707 |
Конференция/семинар: | V Russian Summer School in Information Retrieval (RuSSIR’2011) V Российская летняя школа по информационному поиску (RuSSIR’2011) EDBT Summer Schools |
Дата конференции/семинара: | 15.08.2011–19.08.2011 |
ISBN: | 978-5-288-05225-5 |
Источники: | RuSSIR/EDBT2011 |
Располагается в коллекциях: | Информационный поиск |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
RuSSIR_2011_01.pdf | 217,59 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.