Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://elar.urfu.ru/handle/10995/58736
Название: Голосовой замок
Другие названия: Voice Lock
Авторы: Жданов, А. Е.
Доросинский, Л. Г.
Zhdanov, A. E.
Dorosinsky, L. G.
Дата публикации: 2017
Издатель: Уральский федеральный университет
Библиографическое описание: Жданов А. Е. Голосовой замок / А. Е. Жданов, Л. Г. Доросинский // Ural Radio Engineering Journal. — 2017. — Vol. 1, No. 1. — P. 80-90.
Аннотация: В данной статье представлено обобщенное решение задачи идентификации личности говорящего по речевому сигналу. В среде программирования MATLAB авторами была разработана программа, реализующая различение (дискриминацию) речевых сигналов по коэффициенту корреляции Пирсона между корреляционной функцией входного речевого сигнала и корреляционными функциями эталонных речевых сигналов. Разработанная программа определяет истинный речевой сигнал с вероятностью 60–100 % при коэффициенте шума 0–0,3. Достоинством выведенного алгоритма является быстрая скорость вычислений, а недостатком — отсутствие дополнительного программного алгоритма шумопонижения входного речевого сигнала.
The aim of this article is to identify the speaker’s personality by a speech signal. The speech recognition system identifies people’s individuality by comparison the speech signal of a speaker and the standard speech signal. The article shows an overview of speech signal recognition methods, such as the dynamic programming, the discriminant analysis (which is based on Bayesian discrimination) and the hidden Markov’s model method, as well as an artificial neural network. To solve the speaker’s personality determination aim, we choose the discriminant analysis method which is based on the comparison of the speaker’s speech signal and the standard speech signal. Using the MATLAB programming software, we have developed a program which discriminates speech signals based on the Pearson correlation coefficient between the correlation function of the input speech signal and the correlation functions of the standard speech signals. If a noise factor is ranges from 0 to 0.3, the program determines the correct speech signal with a probability range from 60 to 100 %. The advantage of the developed algorithm is the fast computational speed. However, the absence of an additional software algorithm for noise reduction of the input speech signal is the disadvantage. Thus, the presented article considers a generalized solution of this problem.
Ключевые слова: SPEECH SIGNAL IDENTIFICATION
DISCRIMINANT ANALYSIS OF SPEECH RECOGNITION
CORRELATION FUNCTION
PEARSON CORRELATION COEFFICIENT
ИДЕНТИФИКАЦИЯ РЕЧЕВОГО СИГНАЛА
ДИСКРИМИНАНТНЫЙ АНАЛИЗ РАСПОЗНАВАНИЯ РЕЧИ
КОРРЕЛЯЦИОННАЯ ФУНКЦИЯ
КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ПИРСОНА
URI: http://elar.urfu.ru/handle/10995/58736
Идентификатор РИНЦ: https://elibrary.ru/item.asp?id=35105379
ISSN: 2588-0454 (Print)
2588-0462 (Online)
DOI: 10.15826/urej.2017.1.1.004
Источники: Ural Radio Engineering Journal. 2017. Vol. 1. № 1
Располагается в коллекциях:Ural Radio Engineering Journal

Файлы этого ресурса:
Файл Описание РазмерФормат 
urej-2017-1-07.pdf1,12 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.