Please use this identifier to cite or link to this item: http://hdl.handle.net/10995/72068
Title: Machine learning in the processing and analysis of texts
Other Titles: Машинное обучение в обработке и анализе текстов
Authors: Ptukhin, A. A.
Khrushkov, A. E.
Bozhko, E. M.
Птухин, А. А.
Хрушков, А. Е.
Божко, Е. М.
Issue Date: 2019
Publisher: ООО «Издательский Дом «Ажур»
Citation: Птухин А. А. Машинное обучение в обработке и анализе текстов / А. А. Птухин, А. Е. Хрушков, Е. М. Божко // Язык в сфере профессиональной коммуникации : сборник материалов международной научно-практической конференции преподавателей, аспирантов и студентов (Екатеринбург, 18 апреля 2019 года). — Екатеринбург : ООО «Издательский Дом «Ажур», 2019. — С. 517-523.
Abstract: Natural language processing technologies have made great progress today, and considerable merit in this belongs to machine learning, which is used, particularly, for understanding texts. Neural network technologies can be used in any task where text classification is necessary, whether it is spam filtering, fraud defining or credit scoring, determining the mood of a text, or even the author’s tendency to be depressed, etc. In almost every paper in the collections of leading linguistic conferences, neural network methods are mentioned. Their popularity is largely due to their ability to find complex, sometimes hidden relationships in the data. However, in order for neural networks to fully demonstrate their practical effectiveness, large amounts of textual data are needed for training. This article tells about the language models used before the neural network revolution, whether it is possible to transfer the text to the computer's memory without losing its structure and semantics, and how a smartphone tells us words in messages, as well as about the use of neural network technologies in linguistics.
Технологии обработки естественного языка сегодня шагнули далеко вперед, и немалая заслуга в этом принадлежит машинному обучению, применяемому, в частности, для понимания текстов. Нейросетевые технологии могут быть использованы в любой задаче, где необходимо классифицировать тексты, будь то фильтрация спама, определение мошенничества или кредитный скоринг, определение настроения текста или даже склонности автора текста к депрессии. Почти в каждой статье в сборниках ведущих лингвистических конференций используются нейросетевые методы. Популярность нейронных сетей во многом вызвана их способностью находить сложные, порой скрытые зависимости в данных. Однако для того, чтобы они могли в полной мере продемонстрировать свою практическую эффективность, необходимы большие объемы текстовых данных для эффективного обучения сетей. Данная статья рассказывает, какие языковые модели использовали до нейросетевой революции, возможно ли передать текст без потери структуры и семантики в память компьютера и каким образом смартфон подсказывает нам слова в сообщениях, а также о применении нейросетевых технологий в лингвистике.
Keywords: MACHINE LEARNING
AUTOMATIC TEXT PROCESSING
TEXT MARKUP
NEURAL NETWORKS
МАШИННОЕ ОБУЧЕНИЕ
АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТА
РАЗМЕТКА ТЕКСТА
НЕЙРОННЫЕ СЕТИ
URI: http://hdl.handle.net/10995/72068
Conference name: International research to practice conference for educators, postgraduates and students "Languages in professional communication"
Международная научно-практическая конференция преподавателей, аспирантов и студентов «Язык в сфере профессиональной коммуникации»
Conference date: 18.04.2019
ISBN: 978-5-91256-441-3
Origin: Язык в сфере профессиональной коммуникации. — Екатеринбург, 2019
Appears in Collections:Конференции, семинары

Files in This Item:
File Description SizeFormat 
978-5-91256-441-3_2019_091.pdf253,24 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.