Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://elar.urfu.ru/handle/10995/58736
Название: | Голосовой замок |
Другие названия: | Voice Lock |
Авторы: | Жданов, А. Е. Доросинский, Л. Г. Zhdanov, A. E. Dorosinsky, L. G. |
Дата публикации: | 2017 |
Издатель: | Уральский федеральный университет |
Библиографическое описание: | Жданов А. Е. Голосовой замок / А. Е. Жданов, Л. Г. Доросинский // Ural Radio Engineering Journal. — 2017. — Vol. 1, No. 1. — P. 80-90. |
Аннотация: | В данной статье представлено обобщенное решение задачи идентификации личности говорящего по речевому сигналу. В среде программирования MATLAB авторами была разработана программа, реализующая различение (дискриминацию) речевых сигналов по коэффициенту корреляции Пирсона между корреляционной функцией входного речевого сигнала и корреляционными функциями эталонных речевых сигналов. Разработанная программа определяет истинный речевой сигнал с вероятностью 60–100 % при коэффициенте шума 0–0,3. Достоинством выведенного алгоритма является быстрая скорость вычислений, а недостатком — отсутствие дополнительного программного алгоритма шумопонижения входного речевого сигнала. The aim of this article is to identify the speaker’s personality by a speech signal. The speech recognition system identifies people’s individuality by comparison the speech signal of a speaker and the standard speech signal. The article shows an overview of speech signal recognition methods, such as the dynamic programming, the discriminant analysis (which is based on Bayesian discrimination) and the hidden Markov’s model method, as well as an artificial neural network. To solve the speaker’s personality determination aim, we choose the discriminant analysis method which is based on the comparison of the speaker’s speech signal and the standard speech signal. Using the MATLAB programming software, we have developed a program which discriminates speech signals based on the Pearson correlation coefficient between the correlation function of the input speech signal and the correlation functions of the standard speech signals. If a noise factor is ranges from 0 to 0.3, the program determines the correct speech signal with a probability range from 60 to 100 %. The advantage of the developed algorithm is the fast computational speed. However, the absence of an additional software algorithm for noise reduction of the input speech signal is the disadvantage. Thus, the presented article considers a generalized solution of this problem. |
Ключевые слова: | SPEECH SIGNAL IDENTIFICATION DISCRIMINANT ANALYSIS OF SPEECH RECOGNITION CORRELATION FUNCTION PEARSON CORRELATION COEFFICIENT ИДЕНТИФИКАЦИЯ РЕЧЕВОГО СИГНАЛА ДИСКРИМИНАНТНЫЙ АНАЛИЗ РАСПОЗНАВАНИЯ РЕЧИ КОРРЕЛЯЦИОННАЯ ФУНКЦИЯ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ПИРСОНА |
URI: | http://elar.urfu.ru/handle/10995/58736 |
Идентификатор РИНЦ: | https://elibrary.ru/item.asp?id=35105379 |
ISSN: | 2588-0454 (Print) 2588-0462 (Online) |
DOI: | 10.15826/urej.2017.1.1.004 |
Источники: | Ural Radio Engineering Journal. 2017. Vol. 1. № 1 |
Располагается в коллекциях: | Ural Radio Engineering Journal |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
urej-2017-1-07.pdf | 1,12 MB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.