Please use this identifier to cite or link to this item: http://hdl.handle.net/10995/58736
Title: Голосовой замок
Other Titles: Voice Lock
Authors: Жданов, А. Е.
Доросинский, Л. Г.
Zhdanov, A. E.
Dorosinsky, L. G.
Issue Date: 2017
Publisher: Уральский федеральный университет
Citation: Жданов А. Е. Голосовой замок / А. Е. Жданов, Л. Г. Доросинский // Ural Radio Engineering Journal. — 2017. — Vol. 1, No. 1. — P. 80-90.
Abstract: В данной статье представлено обобщенное решение задачи идентификации личности говорящего по речевому сигналу. В среде программирования MATLAB авторами была разработана программа, реализующая различение (дискриминацию) речевых сигналов по коэффициенту корреляции Пирсона между корреляционной функцией входного речевого сигнала и корреляционными функциями эталонных речевых сигналов. Разработанная программа определяет истинный речевой сигнал с вероятностью 60–100 % при коэффициенте шума 0–0,3. Достоинством выведенного алгоритма является быстрая скорость вычислений, а недостатком — отсутствие дополнительного программного алгоритма шумопонижения входного речевого сигнала.
The aim of this article is to identify the speaker’s personality by a speech signal. The speech recognition system identifies people’s individuality by comparison the speech signal of a speaker and the standard speech signal. The article shows an overview of speech signal recognition methods, such as the dynamic programming, the discriminant analysis (which is based on Bayesian discrimination) and the hidden Markov’s model method, as well as an artificial neural network. To solve the speaker’s personality determination aim, we choose the discriminant analysis method which is based on the comparison of the speaker’s speech signal and the standard speech signal. Using the MATLAB programming software, we have developed a program which discriminates speech signals based on the Pearson correlation coefficient between the correlation function of the input speech signal and the correlation functions of the standard speech signals. If a noise factor is ranges from 0 to 0.3, the program determines the correct speech signal with a probability range from 60 to 100 %. The advantage of the developed algorithm is the fast computational speed. However, the absence of an additional software algorithm for noise reduction of the input speech signal is the disadvantage. Thus, the presented article considers a generalized solution of this problem.
Keywords: SPEECH SIGNAL IDENTIFICATION
DISCRIMINANT ANALYSIS OF SPEECH RECOGNITION
CORRELATION FUNCTION
PEARSON CORRELATION COEFFICIENT
ИДЕНТИФИКАЦИЯ РЕЧЕВОГО СИГНАЛА
ДИСКРИМИНАНТНЫЙ АНАЛИЗ РАСПОЗНАВАНИЯ РЕЧИ
КОРРЕЛЯЦИОННАЯ ФУНКЦИЯ
КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ПИРСОНА
URI: http://hdl.handle.net/10995/58736
RSCI ID: https://elibrary.ru/item.asp?id=35105379
ISSN: 2588-0454 (Print)
2588-0462 (Online)
DOI: 10.15826/urej.2017.1.1.004
Origin: Ural Radio Engineering Journal. 2017. Vol. 1. № 1
Appears in Collections:Ural Radio Engineering Journal

Files in This Item:
File Description SizeFormat 
urej-2017-1-07.pdf1,12 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.