Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/133794
Название: Классификация длинных текстов
Другие названия: LONG TEXT CLASSIFICATION
Авторы: Маяцкая, Е. А.
Mayatskaya, E. A.
Дата публикации: 2024
Издатель: Издательский Дом «Ажур»
Библиографическое описание: Маяцкая Е. А. Классификация длинных текстов / Е. А. Маяцкая. — Текст : электронный // ИНТЕР – Информационные технологии и радиоэлектроника : сборник тезисов студенческой конференции (Екатеринбург, 13-14 мая 2024 г.). — Екатеринбург : Издательский Дом «Ажур», 2024. — C. 83-87.
Аннотация: При обработке длинных последовательностей трансформеры сталкиваются с ограничением на объем входных данных. В данной работе разработан метод, позволяющий обрабатывать длинные тексты. Метод основан на сегментации входного текста на несколько фрагментов и последующей подачи их в базовую модель. Для эффективной обработки корпуса текстов разработан подход ускоряющий процесс создания векторного представления текста. Проведен анализ производительности алгоритма, который показал, что разработанный метод достиг конкурентоспособных результатов на четырех наборах данных.
When processing long sequences, transformers face a limitation on the amount of input data. In this work, a method has been developed that allows processing long texts. The method is based on segmenting the input text into several fragments and then feeding them into the base model. For efficient processing of a text corpus, an approach has been developed that speeds up the process of creating a vector representation of text. An analysis of the algorithm's performance was carried out, which showed that the developed method achieved competitive results on four data sets.
Cet article examine la structure de l'éducation en France, les niveaux d'énseignement ainsi que le système d'évaluation. Il a été établi que l'évaluation, en tant que moyen d'améliorer la qualité de la formation scolaire, a une valeur de référence optimale. À cet égard, nous avons fait une comparaison des évaluations finales et intermédiaires menées pour les étudiants en France et en Russie. Nous avons examiné également la transition du système d'évaluation de 20 points établi de l'éducation française.
Ключевые слова: CLASSIFICATION
EMBEDDINGS
BERT
RECURRENT NEURAL NETWORKS
КЛАССИФИКАЦИЯ
ВЕКТОРНОЕ ПРЕДСТАВЛЕНИЕ ТЕКСТА
BERT
РЕКУРРЕНТНЫЕ НЕЙРОННЫЕ СЕТИ
URI: http://elar.urfu.ru/handle/10995/133794
Конференция/семинар: Всероссийская научная студенческая конференция «ИНТЕР – Информационные технологии и радиоэлектроника»
Дата конференции/семинара: 13.05.2024-14.05.2024
ISBN: 978-5-91256-646-2
Источники: ИНТЕР – Информационные технологии и радиоэлектроника (2024)
Располагается в коллекциях:Конференции, семинары

Файлы этого ресурса:
Файл Описание РазмерФормат 
978-5-91256-646-2_2024_018.pdf419,53 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.