Please use this identifier to cite or link to this item:
http://elar.urfu.ru/handle/10995/79844
Title: | Распознавание имен собственных и «именованных сущностей» при автоматической обработке текста. Рец. на кн.: Nouvel D., Ehrmann M., Rosset S. Named Entities for Computational Linguistics / D. Nouvel, M. Ehrmann, S. Rosset. — London ; Hoboken : ISTE Ltd : Johm Wiley & Sons, Inc., 2016. — 170 p. |
Other Titles: | Proper Names and Named Entities Recognition in the Automatic Text Processing. Review of the book: Nouvel, D., Ehrmann, M., & Rosset, S. (2016). Named Entities for Computational Linguistics. London; Hoboken: ISTE Ltd; Johm Wiley & Sons, Inc., 2016. 170 p. |
Authors: | Голикова, Д. М. Golikova, D. M. |
Issue Date: | 2018 |
Publisher: | Издательство Уральского университета |
Citation: | Распознавание имен собственных и «именованных сущностей» при автоматической обработке текста / Д. М. Голикова. — Текст : непосредственный // Вопросы ономастики. — 2018. — Т. 15. — №. 1. — С. 207-215. — Рец. на кн.: Nouvel D., Ehrmann M., Rosset S. Named Entities for Computational Linguistics / D. Nouvel, M. Ehrmann, S. Rosset. — London ; Hoboken : ISTE Ltd : Johm Wiley & Sons, Inc., 2016. — 170 p. |
Abstract: | The reviewed book by Damien Nouvel, Maud Ehrmann, and Sophie Rosset Named Entities for Computational Linguistics deals with automatic processing of texts, written in a natural language, and with named entities recognition, aimed at extracting most important information in these texts. The notion of named entities here extends to the entire set of linguistic units referring to an object. The researchers minutely consider the concept of named entities, juxtaposing this category to that of proper names and comparing their defi nitions, and describe all the stages of creation and implementation of automatic text annotation algorithms, as well as different ways of evaluating their performance quality. Proper names, in this context, are seen as a particular instance of named entities, one of the typical sources of reference to real objects to be electronically recognized in the text. The book provides a detailed overview and analysis of previous studies in the same fi eld, based mainly on the English language data. It presents instruments and resources required to create and implement the algorithms in question, these may include typologies, knowledge or data bases, and various types of corpora. Theoretical considerations, proposed by the authors, are supported by a signifi cant number of exemplary cases, with algorithms operation principles presented in charts. The reviewed book gives quite a comprehensive picture of modern computational inguistic studies focused on named entities recognition, and indicates some problems which are unresolved as yet. В рецензии представлен обзор книги Дамьена Нувеля (Damien Nouvel), Мод Эрманн (Maud Ehrmann) и Софи Россе (Sophie Rosset) «Именованные сущности в компьютерной лингвистике» (Named Entities for Computational Linguistics, 2016). Работа посвящена автоматической обработке текстов, написанных на естественном языке, и распознаванию в этих текстах «именованных сущностей» (named entities) с целью извлечения наиболее важной информации. Под именованными сущностями в работе понимается совокупность всех единиц, так или иначе указывающих на референта. Исследователи сравнивают эту категорию с именами собственными и дефинициями и в деталях освещают все этапы создания и применения алгоритмов по автоматическому аннотированию текста, а также различные методы оценки их эффективности. Имя собственное в данном контексте — вид именованной сущности, одна из типичных отсылок к референту, которую машина должна обнаружить в тексте и связать с конкретным явлением реальности. В книге приведен подробный обзор и анализ предшествующих исследований в рассматриваемом направлении, в основном на базе английского языка. Кроме того, представлены инструменты и ресурсы, необходимые для работы с подобного рода программами: аннотированные и неаннотированные корпуса, типологии и базы знаний. Положения работы подкреплены значительным количеством показательных примеров, работа алгоритмов проиллюстрирована с помощью наглядных схем. Рецензируемая книга дает довольно полное представление о современном состоянии практических исследований в области автоматического распознавания и анализа имен собственных и других именованных сущностей, указывает на еще не решенные проблемы в данной области и предлагает пути решения для некоторых из них. |
Keywords: | COMPUTATIONAL LINGUISTICS PROPER NAMES AUTOMATIC TEXT PROCESSING ANNOTATION NAMED ENTITIES CORPUS KNOWLEDGE BASE КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА ИМЕНА СОБСТВЕННЫЕ АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТА АННОТИРОВАНИЕ ИМЕНОВАННЫЕ СУЩНОСТИ КОРПУС БАЗА ЗНАНИЙ |
URI: | http://elar.urfu.ru/handle/10995/79844 |
RSCI ID: | 32561029 |
WOS ID: | WOS:000439845000012 |
ISSN: | 1994-2400 (Print) 1994-2451 (Online) |
DOI: | 10.15826/vopr_onom.2018.15.1.012 |
Origin: | Вопросы ономастики. 2018. Том. 15. № 1 |
Appears in Collections: | Вопросы ономастики |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
vopon_2018_1_014.pdf | 326,03 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.