| Русский Русский | English English |
   
Главная Current Issue
19 | 04 | 2024
10.14489/vkit.2017.09.pp.024-031

DOI: 10.14489/vkit.2017.09.pp.024-031

Корсун О. Н., Михайлов Е. И.
МЕТОД ВЫДЕЛЕНИЯ РЕЧЕВОГО СИГНАЛА, ОСНОВАННЫЙ НА ТЕХНОЛОГИИ КОНТРОЛЬНЫХ КАРТ
(c. 24-31)

Аннотация. Рассмотрена проблема выделения полезного речевого сигнала из потока «речь–фон» и «речь–шум». Предложен алгоритм детектирования речевых команд, основанный на использовании спектральной параметризации речевого сигнала, множественной регрессии и методов статистического анализа, в том числе, контрольных карт. Приведены результаты тестирования алгоритма на речевой базе, включающей в себя 20 различных изолированных слов.

Ключевые слова:  детектирование речевых команд; множественная регрессия; метод контрольных карт.

 

Korsun O. N., Mikhaylov E. I.
THE METHOD FOR SPEECH DETECTION BASED ON CONTROL CHARTS TECHNIQUES
(pp. 24-31)

Abstract. The speech technologies are being developed intensively in the recent years, especially the automatic speech recognition as an additional channel between human interface and technical devices. One of the most important parts of speech recognition is speech signal detection from non-speech signals. Widespread methods, like amplitude detection, have low accuracy in noisy conditions and at low signal/noise ratio. The article is devoted to a problem of improving accuracy of detecting a useful speech signal from the stream «speech–background» and «speech–noise». A new approach is proposed for this purpose. This new approach is based on the joint use of spectral parametrization, linear multiple regression and methods of statistical analysis, including control charts. It is assumed that basic features of the speech signal distinguishing it from the background, noise and other non-speech signals are contained in a small number of different words (reference words). For example, group of three words was selected in this article. The speech signal is decomposed by a basis of reference words. The estimation of the speech signal level is calculated as the sum of squares of the projections onto the vectors of reference words, using sliding window. In the absence of a speech signal in the sliding window, the value of the estimation is small, because noises and non-speech signals are weakly correlated with speech. When a speech signal appears in the sliding window, the value of the estimation increases rapidly, which is a diagnostic sign of the word. The advantage of the proposed algorithm is that it detects almost any words that do not match with the selected basis of reference words. The practical importance of the problem is that detected words are used for purposes of automatic speech recognition. This article presents the detection algorithm based on proposed methods. The experimental results of approbation of the developed algorithm on the base, which includes twenty different isolated words, are also discussed in the article.

Keywords: Detection of speech commands; Multiple regression; Method of control charts.

Рус

О. Н. Корсун (ФГУП «Государственный научно-исследовательский институт авиационных систем» ГНЦ РФ, Москва, Россия)
Е. И. Михайлов (Московский физико-технический институт (государственный университет), Москва, Россия) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript

 

Eng

O. N. Korsun (State Research Institute of Aviation Systems State Scientific Center of Russian Federation, Moscow, Russia)
E. I. Mikhaylov (Moscow Institute of Physics and Technology (State University), Moscow, Russia) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript

 

Рус

1. Бондарос Ю. Г., Маковкин К. А., Чучупал В. Я. Система распознавания команд речевого интерфейса пилота для интегрированной модульной авионики // Вестник компьютерных и информационных технологий. 2007. № 4. С. 2 – 13.
2. Бондарос Ю. Г., Колоколов А. С., Костюк А. И. Использование речевых сигналов в условиях кабины летательного аппарата // Вестник компьютерных и информационных технологий. 2008. № 4. С. 2 – 10.
3. Алгоритм автоматического распознавания речевых команд, инвариантный к изменению языка / О. Н. Корсун и др. // Мехатроника, автоматизация, управление. 2015. № 9. С. 599 – 604.
4. Корсун О. Н., Габдрахманов А. Ш. Помехо-защищенный алгоритм речевого управления бортовым оборудованием самолета // Вестник компьютерных и информационных технологий. 2014. № 4. С. 3 – 7.
5. Вознесенская Т. В., Котов М. А., Леднов Д. А. Гибридный детектор речи // Цифровая обработка сигналов. 2014. № 4. С. 54 – 58.
6. Peinado A. M., Segura J. C. Speech Recognition over Digital Channels. Robustness and Standards. // John Wiley and Sons, Ltd, The Atrium, southern Gate, Chichester, England. 2006. 257 p.
7. Rabiner L., Juang B. H. Fundamentals of Speech Recognition // Prentice – Hall International, Inc., Englewood Cliffs, New Jersey. 1993. 507 p.
8. Rabiner L. R. (1989). Hidden markov models and their application in selected applications in speech recognition (TIIER), 77(2). Р. 86 – 120.
9. Корсун О. Н., Михайлов Е. И. Алгоритм детектирования речевых команд, устойчивый к воздействию акустических помех. // Вопросы авионики: тр. ГосНИИАС. 2015. № 4(24). С. 31 – 36.
10. ГОСТ Р 50779.42–99 (ИСО 8258–91). Статистические методы. Контрольные карты Шухарта. М.: Изд-во стандартов, 1999. 31 с.
11. ГОСТ Р ИСО 16269-6–2005. Статистические методы. Статистическое представление данных. Определение статистических толерантных интервалов. М.: Стандартинформ. 2005. 23 с.

Eng

1. Bondaros Iu. G., Makovkin K. A., Chuchupal V. Ia. (2007). The system of recognition of voice commands in pilot's interface for integrated modular avionics. Vestnik komp'iuternykh i informatsionnykh tekhnologii, (4), pp. 2-13. [in Russian language]
2. Bondaros Iu. G., Kolokolov A. S., Kostiuk A. I. (2008). Using voice signals in the conditions of the cabin of an aircraft. Vestnik komp'iuternykh i informatsionnykh tekhnologii, (4), pp. 2-10. [in Russian language]
3. Korsun O. N. et al. (2015). Algorithm for an automatic recognition of the speech commands invariant to languages. Mekhatronika, avtomatizatsiia, upravlenie, 16(9), pp. 599-604. doi: 10.17587/mau.16.599-604 [in Russian language]
4. Korsun O. N., Gabdrakhmanov A. Sh. (2014). Noise resistant algorithm of voice control of aircraft equipment. Vestnik komp'iuternykh i informatsionnykh tekhnologii, (4), pp. 3-7. doi: 10.14489/vkit.2014.04. pp.003-007 [in Russian language]
5. Voznesenskaia T. V., Kotov M. A., Lednov D. A. (2014). Hybrid speech detector. Tsifrovaia obrabotka signalov, (4), pp. 54-58. [in Russian language]
6. Peinado A. M., Segura J. C. (2006). Speech recognition over digital channels. Robustness and standards. John Wiley and Sons, Ltd, The Atrium, southern Gate, Chichester, England.
7. Rabiner L., Juang B. H. (1993). Fundamentals of speech recognition. Prentice – Hall International, Inc., Englewood Cliffs, New Jersey.
8. Rabiner L. R. (1989). Hidden markov models and their application in selected applications in speech recognition. TIIER, 77(2), pp. 86-120.
9. Korsun O. N., Mikhailov E. I. (2015). Algorithm for detecting speech commands, resistant to acoustic noise. Voprosy avioniki: trudy GosNIIAS, 24(4), pp. 31-36. [in Russian language]
10. Statistical methods. Shewhart's control charts. (1999). Ru Standard No. GOST R 50779.42–99 (ISO 8258–91). Moscow: Izdatel'stvo standartov. [in Russian language]
11. Statistical methods. Statistical representation of data. The definition of statistical tolerant intervals. (2005). Ru Standard No. GOST R ISO 16269-6–2005. Moscow: Standartinform. [in Russian language]

Рус

Статью можно приобрести в электронном виде (PDF формат).

Стоимость статьи 350 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке.

После поступления денег на счет издательства, вам будет выслан электронный вариант статьи.

Для заказа скопируйте doi статьи:

10.14489/vkit.2017.09.pp.024-031

и заполните  ФОРМУ 

Отправляя форму вы даете согласие на обработку персональных данных.

.

Eng

This article  is available in electronic format (PDF).

The cost of a single article is 350 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank.

After depositing your payment on our bank account we send you file of the article by e-mail.

To order articles please copy the article doi:

14489/vkit.2017.09.pp.024-031

and fill out the  FORM  

.

 

 

 
Search
Баннер
Баннер
Rambler's Top100 Яндекс цитирования