Machine learning in the processing and analysis of texts

Ptukhin, A. A.; Khrushkov, A. E.; Bozhko, E. M.; Птухин, А. А.; Хрушков, А. Е.; Божко, Е. М.

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/72068

Название:	Machine learning in the processing and analysis of texts
Другие названия:	Машинное обучение в обработке и анализе текстов
Авторы:	Ptukhin, A. A. Khrushkov, A. E. Bozhko, E. M. Птухин, А. А. Хрушков, А. Е. Божко, Е. М.
Дата публикации:	2019
Издатель:	ООО «Издательский Дом «Ажур»
Библиографическое описание:	Птухин А. А. Машинное обучение в обработке и анализе текстов / А. А. Птухин, А. Е. Хрушков, Е. М. Божко // Язык в сфере профессиональной коммуникации : сборник материалов международной научно-практической конференции преподавателей, аспирантов и студентов (Екатеринбург, 18 апреля 2019 года). — Екатеринбург : ООО «Издательский Дом «Ажур», 2019. — С. 517-523.
Аннотация:	Natural language processing technologies have made great progress today, and considerable merit in this belongs to machine learning, which is used, particularly, for understanding texts. Neural network technologies can be used in any task where text classification is necessary, whether it is spam filtering, fraud defining or credit scoring, determining the mood of a text, or even the author’s tendency to be depressed, etc. In almost every paper in the collections of leading linguistic conferences, neural network methods are mentioned. Their popularity is largely due to their ability to find complex, sometimes hidden relationships in the data. However, in order for neural networks to fully demonstrate their practical effectiveness, large amounts of textual data are needed for training. This article tells about the language models used before the neural network revolution, whether it is possible to transfer the text to the computer's memory without losing its structure and semantics, and how a smartphone tells us words in messages, as well as about the use of neural network technologies in linguistics. Технологии обработки естественного языка сегодня шагнули далеко вперед, и немалая заслуга в этом принадлежит машинному обучению, применяемому, в частности, для понимания текстов. Нейросетевые технологии могут быть использованы в любой задаче, где необходимо классифицировать тексты, будь то фильтрация спама, определение мошенничества или кредитный скоринг, определение настроения текста или даже склонности автора текста к депрессии. Почти в каждой статье в сборниках ведущих лингвистических конференций используются нейросетевые методы. Популярность нейронных сетей во многом вызвана их способностью находить сложные, порой скрытые зависимости в данных. Однако для того, чтобы они могли в полной мере продемонстрировать свою практическую эффективность, необходимы большие объемы текстовых данных для эффективного обучения сетей. Данная статья рассказывает, какие языковые модели использовали до нейросетевой революции, возможно ли передать текст без потери структуры и семантики в память компьютера и каким образом смартфон подсказывает нам слова в сообщениях, а также о применении нейросетевых технологий в лингвистике.
Ключевые слова:	MACHINE LEARNING AUTOMATIC TEXT PROCESSING TEXT MARKUP NEURAL NETWORKS МАШИННОЕ ОБУЧЕНИЕ АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТА РАЗМЕТКА ТЕКСТА НЕЙРОННЫЕ СЕТИ
URI:	http://elar.urfu.ru/handle/10995/72068
Конференция/семинар:	International research to practice conference for educators, postgraduates and students "Languages in professional communication" Международная научно-практическая конференция преподавателей, аспирантов и студентов «Язык в сфере профессиональной коммуникации»
Дата конференции/семинара:	18.04.2019
ISBN:	978-5-91256-441-3
Источники:	Язык в сфере профессиональной коммуникации. — Екатеринбург, 2019
Располагается в коллекциях:	Конференции, семинары

Файлы этого ресурса:

Файл	Описание	Размер	Формат
978-5-91256-441-3_2019_091.pdf		253,24 kB	Adobe PDF	Просмотреть/Открыть

Показать полное описание ресурса Статистика

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.