Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/39782
Название: Кластеризация русскоязычных текстов с применением статистики χ²
Другие названия: Clustering of Russian texts using χ² statistics
Авторы: Филимонов, В. В.
Амиева, А. М.
Сергеев, А. П.
Filimonov, V. V.
Amieva, A. M.
Sergeev, A. P.
Дата публикации: 2016
Издатель: Уральский федеральный университет
Библиографическое описание: Филимонов В. В. Кластеризация русскоязычных текстов с применением статистики χ² / В. В. Филимонов, А. М. Амиева, А. П. Сергеев // Информация: передача, обработка, восприятие : материалы международной научно-практической конференции (Екатеринбург, 12–13 января 2016 г.). — Екатеринбург : УрФУ, 2016. — С. 164-174.
Аннотация: Проблема обнаружения скрытых структур текста связана с перспективной методикой установления авторства. В работе описан Корпус текстов русского языка, созданный для исследований текстов методами математической статистики. Описывается исследование, проведённое на базе Корпуса с применением статистики χ2. Кластеризация текстов, обнаруженная в результате исследования, может служить основанием для их атрибуции. Работа выполнена на кафедре полиграфии и веб-дизайна ИРИТ-РтФ УрФУ.
The problem of detection of the hidden structures of the text is associated with a promising method of attribution. The paper describes a corpus of Russian language created for investigations of texts by the methods of mathematical statistics. The research conducted on the basis of the statistics χ2 is described. Clustering of texts discovered by the study can serve as a basis for their attribution. The work was coudveted at the department of printing art and web-design, Ural Federal University.
Ключевые слова: КОРПУС
ЧАСТОТА
ВЕРОЯТНОСТЬ
СТАТИСТИКА χ2
ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ
CASE
FREQUENCY
PROBABILITY
χ2 STATISTICS
DISTRIBUTION FUNCTION
URI: http://elar.urfu.ru/handle/10995/39782
Конференция/семинар: Международная научно-практическая конференция "Информация: передача, обработка, восприятие"
Дата конференции/семинара: 12.01.2016-13.01.2016
Идентификатор РИНЦ: https://elibrary.ru/item.asp?id=26618305
ISBN: 978-5-7996-1424-9
Источники: Информация: передача, обработка, восприятие. — Екатеринбург, 2016.
Располагается в коллекциях:Конференции, семинары

Файлы этого ресурса:
Файл Описание РазмерФормат 
ipov_2016_16.pdf608,18 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.