| Русский Русский | English English |
   
Главная Архив номеров
19 | 11 | 2024
10.14489/vkit.2017.01.pp.010-015

DOI: 10.14489/vkit.2017.01.pp.010-015

Корсун О. Н., Габдрахманов А. Ш.
РАСПОЗНАВАНИЕ РЕЧЕВЫХ КОМАНД НА ОСНОВЕ ИСПОЛЬЗОВАНИЯ СТАЦИОНАРНЫХ СООТНОШЕНИЙ С ЭТАЛОНАМИ «ЧУЖИХ» СЛОВ
(c. 10-15)

Аннотация. ассмотрена задача повышения точности автоматического распознавания речевых команд. Для повышения уровня распознавания предложено использовать информацию о стационарных соотношениях распознаваемого слова не только с соответствующим ему эталоном, но и со всеми другими, входящими в словарь, что позволяет получить дополнительную информацию, повышающую вероятность успешного распознавания. Разработана модифицированная мера близости между параметрическим портретом распознаваемого слова и эталонами, заключающаяся в нахождении среднего по кадрам z-преобразования Фишера от коэффициента корреляции. Представлены экспериментальные результаты оценки эффективности разработанных алгоритмов на значительном объеме речевых данных.

Ключевые слова:  автоматическое распознавание речи; алгоритмы распознавания; речевое управление; голосовые команды; дикторонезависимое распознавание; повышение качества распознавания речи.

 

Korsun O. N., Gabdrakhmanov A. Sh.
SPEECH RECOGNITION BASED ON RELATIONS WITH АLL THE PATTERNS IN THE DICTIONARY
(pp. 10-15)

Abstract. The speech technologies are being developed intensively in the recent years, especially the automatic speech recognition as an additional input method in human interface and technical devices. Most of the known algorithms for speech recognition have small probability of correct recognition. Widespread methods, like Markov models and neural networks, which require large processing power, allow recognizing the words with a probability of no more than 85…92 %. Such accuracy is not enough to use the voice control on board of modern aircraft. The article is devoted to improving the automatic speech recognition’s accuracy. A version of word recognition algorithm based on the classical approach is suggested, it includes the comparison with the patterns. In this work to improve the recognition’s performance a new approach to calculating a similarity measure between the recognized word and the pattern, which based on z-Fisher transformation, is described. This article also contains an algorithm’s that takes into account the relations with all the other patterns in the dictionary. This algorithm also uses the words length adjustment to the pattern based on dynamic programming. The use of the relations between words provides additional information, which positively affects the recognition. The developed algorithm efficiency is tested by processing a large amount of the speech data.

Keywords: Automatic speech recognition; Algorithms of recognition; Voice control; Voice commands; Speaker-independent recognition; Improving the quality of speech recognition.

Рус

О. Н. Корсун (ФГУП «Государственный научно-исследовательский институт авиационных систем» ГНЦ РФ, Москва, Россия)
А. Ш. Габдрахманов (Московский физико-технический институт (государственный университет), Москва, Россия) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript

 

Eng

O. N. Korsun (State Research Institute of Aviation Systems State Scientific Center of Russian Federation, Moscow, Russia)
A. Sh. Gabdrakhmanov (Moscow Institute of Physics and Technology (State University), Moscow, Russia) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript

 

Рус

1. Корсун О. Н., Габдрахманов А. Ш., Сошников В. Н. Проблемы алгоритмического обеспечения системы речевого управления бортовым оборудованием самолета // Тр. ГосНИИАС. Сер. Вопросы авионики. 2016. № 1(25). С. 24 – 32.
2. Корсун О. Н., Лаврова Г. А., Себряков Г. Г. Синтез 3D-аудиосигналов для звукового интерфейса перспективной кабины летательного аппарата // Всерос. науч.-техн. конф. «Моделирование авиационных систем»: сб. докл. М., 2011. Т. 3. С. 452 – 458.
3. Исследование речевых сигналов операторов критичных по безопасности систем / Ю. Г. Бондарос и др. // Вестник компьютерных и информационных технологий. 2009. № 11. С. 2 – 11.
4. Peinado A. M., Segura J. C. Speech Recognition over Digital Channels. Hoboken, New Jersey: John Wiley&Sons, 2006. 274 p.
5. Rabiner L., Juang B.-H. Fundamentals of Speech Recognition. Englewood Cliffs, New Jersey: Prentice-Hall International, 1993. 507 p.
6. Методика экспериментального исследования влияния пилотажной перегрузки на характеристики речи в целях создания речевого интерфейса бортового оборудования самолетов / О. Н. Корсун и др. // Вестник компьютерных и информационных технологий. 2012. № 5. С. 3 – 7.
7. Результаты экспериментальных исследований влияния пилотажной перегрузки на характеристики речи / О. Н. Корсун и др. // Вестник компьютерных и информационных технологий. 2012. № 6. С. 3 – 7.
8. Экспериментальное исследование влияния акустических помех разных видов на результаты автоматического распознавания речевых команд / О. Н. Корсун и др. // Наука и образование: научное издание МГТУ им. Н. Э. Баумана. 2013. № 1. С. 103 – 114.
9. Корсун О. Н., Финаев И. М., Габдрахманов A. Ш. Экспериментальное оценивание помехоустойчивого алгоритма распознавания речевых команд с использованием дополнительного микрофона // Научные чтения по авиации, посвященные памяти Н. Е. Жуковского. 2013. № 1. С. 330 – 334.
10. Исследование характеристик речи дикторов-пилотов с нарушениями слуха в интересах создания системы речевого управления бортовым управлением летательных аппаратов / А. И. Иванов и др. // Медицина труда и промышленная экология. 2014. № 11. С. 40 – 45.
11. Алгоритм автоматического распознавания речевых команд, инвариантный к изменению языка / О. Н. Корсун и др. // Мехатроника, автоматизация, управление. 2015. Т. 16, № 9. С. 599 – 604.
12. Корсун О. Н., Габдрахманов А. Ш. Повышение качества распознавания речевых команд на основе устойчивых соотношений между словами // Научные чтения по авиации, посвященные памяти Н. Е. Жуковского. 2016. № 4. С. 331 – 336.
13. Корсун О. Н., Габдрахманов А. Ш. Алгоритм адаптации распознаваемого слова в задаче повышения помехоустойчивости речевого управления бортовым оборудованием самолета // Научные чтения по авиации, посвященные памяти Н. Е. Жуковского. 2015. № 3. С. 184 – 187.
14. Вентцель Е. С. Исследование операций: задачи, принципы, методология. М.: ДРОФА, 1988. 208 с.
15. Корсун О. Н., Полиев А. В. Автоматическое выделение фонетически однородных участков в словах естественного языка на основе многопараметрической оптимизации // Изв. РАН. Теория и системы управления. 2016. № 4. С. 115 – 124.

Eng

1. Korsun O. N., Gabdrakhmanov A. Sh., Soshnikov V. N. (2016). Problems of algorithmic support of the aircraft avionics voice control system. Trudy GosNIIAS. Seriia: Voprosy avioniki, 25(1), pp. 24-32. [in Russian language]
2. Korsun O. N., Lavrova G. A., Sebriakov G. G. (2011). Synthesis of 3D-audio signals to audio interface of perspective cabin of the aircraft. Proceedings of the All-Russian scientific and technical conference «Simulation of the Aircraft Systems». Vol. 3, pp. 425-458. Moscow. [in Russian language]
3. Bondaros Iu. G. (2009). Speech signals operators research, critical for safety systems. Vestnik komp'iuternykh i informatsionnykh tekhnologii, (11), pp. 2-11.
4. Peinado A. M., Segura J. C. (2006). Speech recognition over digital channels. Hoboken, New Jersey: John Wiley&Sons.
5. Rabiner L., Juang B.-H. (1993). Fundamentals of speech recognition. Englewood Cliffs, New Jersey: Prentice-Hall International.
6. Korsun O. N. et al. (2012). The technique for methodic for experimental research of overload influence on speech characteristics for avionics speech interface design. Vestnik komp'iuternykh i informatsionnykh tekhnologii, (5), pp. 3-7. [in Russian language]
7. Korsun O. N. et al. (2012). Experimental research of overload influence on speech characteristics. Vestnik komp'iuternykh i informatsionnykh tekhnologii, (6), pp. 3-7. [in Russian language]
8. Korsun O. N. et al. (2013). Experimental research on the effect of acoustic noises of different types on the results of automatic recognition of speech commands. Nauka i obrazovanie: elektronnoe nauchno-tekhnicheskoe izdanie, (1). Available at: http://technomag.edu.ru/doc/508614.html (Accessed: 09.09.2016). doi: 10.7463/0113.0508614 [in Russian language]
9. Korsun O. N., Finaev I. M., Gabdrakhmanov A. Sh. (2013). Experimental evaluation of error-correcting voice recognition algorithm using an optional microphone. Nauchnye chteniia po aviatsii, posviashchennye pamiati N. E. Zhukovskogo, (1), pp. 330-334. [in Russian language]
10. Ivanov A. I. (2014). The study of speech characteristics of speakers pilots with hearing impairments in order to create a voice control system to control onboard equipment of the aircraft. Meditsina truda i promyshlennaia ekologiia, (11), pp. 40-45. [in Russian language]
11. Korsun O. N. et al. (2015). Algorithm for an automatic recognition of the speech commands invariant to languages. Mekhatronika, avtomatizatsiia, upravlenie, 16(9), pp. 599-604. doi: 10.17587/mau.16.599-604 [in Russian language]
12. Korsun O. N., Gabdrakhmanov A. Sh. (2016). Improvement of quality based on voice recognition stable relationships between words. Nauchnye chteniia po aviatsii, posviashchennye pamiati N. E. Zhukovskogo, (4), pp. 331- 336. [in Russian language]
13. Korsun O. N., Gabdrakhmanov A. Sh. (2015). Adaptation algorithm of words recognition in the problem of increasing noise immunity in voice control of aircraft avionics. Nauchnye chteniia po aviatsii, posviashchennye pamiati N. E. Zhukovskogo, (3), pp. 184-187. [in Russian language]
14. Venttsel' E. S. (1988). Operations research. Objectives, principles, methodology. Moscow: Drofa. [in Russian language]
15. Korsun O. N., Poliev A. V. (2016). Automatic selection of phonetically homogeneous areas in the words of natural language based on multiparameter optimization. Izvestiia RAN. Teoriia i sistemy upravleniia, (4), pp. 115-124. doi: 10.7868/S0002338816040089 [in Russian language]

Рус

Статью можно приобрести в электронном виде (PDF формат).

Стоимость статьи 350 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке.

После поступления денег на счет издательства, вам будет выслан электронный вариант статьи.

Для заказа скопируйте doi статьи:

10.14489/vkit.2017.01.pp.010-015

и заполните  ФОРМУ 

Отправляя форму вы даете согласие на обработку персональных данных.

.

Eng

This article  is available in electronic format (PDF).

The cost of a single article is 350 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank.

After depositing your payment on our bank account we send you file of the article by e-mail.

To order articles please copy the article doi:

10.14489/vkit.2017.01.pp.010-015

and fill out the  FORM  

.

 

 

 
Поиск
Rambler's Top100 Яндекс цитирования