DOI: 10.14489/vkit.2018.01.pp.014-023
Корсун О. Н., Полиев А. В. ИСПОЛЬЗОВАНИЕ НЕСКОЛЬКИХ ЭТАЛОНОВ ПРИ РАСПОЗНАВАНИИ РЕЧИ: ФОРМУЛА БАЙЕСА И МЕТОД КОМИТЕТОВ (c. 14-23)
Аннотация. Рассмотрена задача распознавания слов с использованием нескольких эталонов. Предложен метод на основе формулы Байеса, использующий априорные вероятности, определенные на обучающей выборке, с дальнейшим уточнением после каждого распознавания новым эталоном. Также представлен алгоритм с применением метода комитетов, где по результатам распознавания каждым новым эталоном обновляется рейтинг всех возможных исходов распознавания. Для каждого из этих методов приведены результаты экспериментальных исследований, подтверждающие их работоспособность.
Ключевые слова: детектирование речевых команд; распознавание речи; формула Байеса; метод комитетов.
Korsun O. N., Poliyev A. V. MULTIPLE PATTERNS IN SPEECH RECOGNITION: BAYES RULE AND METHOD OF COMMITTEES (pp. 14-23)
Abstract. In the last years speech recognition techniques are being strongly developed. The interest in this field is defined by elaboration of additional channels of interaction between technical devices and human operator. One of the most important problems in speech recognition area is automated detection of speech commands. Widely used methods with Markov chains show poor performance in noisy condition, while various methods employing comparison with patterns perform well in the presence of noise. This article considers the words recognition problem using several patterns. The algorithm for words recognition based on the Bayes rule is proposed. It uses a priori probabilities calculated on a training set and continuously improves them after each recognition with a new pattern. This approach is based on the idea that each new pattern brings some new information, which can give us better a posteriori probabilities of the correct recognition. Furthermore, the algorithm based on the method of committees is presented. After obtaining the recognition results for each new pattern each possible variant for recognition gets some score. This score is proportional to the quality of recognition. The scores of each recognition are summed up to the global rating. And then this rating is used for selection of the best recognition result or for subsequent refinement of result using other methods. For both methods, the testing results are presented for the speech database, which includes 4800 different isolated speech commands of 8 operators.
Keywords: Detection of speech commands; Speech recognition; Bayes rule; Method of committees.
О. Н. Корсун (ФГУП «Государственный научно-исследовательский институт авиационных систем» ГНЦ РФ, Москва, Россия) А. В. Полиев (Московский физико-технический институт (государственный университет), Москва, Россия) E-mail:
Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
O. N. Korsun (State Research Institute of Aviation Systems State Scientific Center of Russian Federation, Moscow, Russia) A. V. Poliyev (Moscow Institute of Physics and Technology (State University), Moscow, Russia) E-mail:
Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
1. Исследование речевых сигналов операторов критичных по безопасности систем / Ю. Г. Бондарос и др. // Вестник компьютерных и информационных технологий. 2009. № 11. С. 2 – 11. 2. Бондарос Ю. Г., Маковкин К. А., Чучупал В. Я. Система распознавания команд речевого интерфейса пилота для интегрированной модульной авионики // Вестник компьютерных и информационных технологий. 2007. № 4. С. 2 – 13. 3. Синтез 3D-аудиосигналов для звукового интерфейса перспективной кабины летательного аппарата / Г. Г. Себряков и др. // Моделирование авиационных систем: сб. докл. в 3 т. М.: ФГУП ГосНИИАС, 2011. Т. 3. С. 452 – 458. 4. Корсун О. Н., Габдрахманов А. Ш. Помехозащищенный алгоритм речевого управления бортовым оборудованием самолета // Вестник компьютерных и информационных технологий. 2014. № 4. С. 3 – 7. 5. Hirsch H.-G., Pearce D. The Aurora Experimental Framework for the Performance Evaluation of Speech Recognition Systems under Noisy Conditions // ASR2000 – Automatic Speech Recognition. 2000. № 1. C. 181 – 188. 6. Экспериментальное исследование влияния акустических помех разных видов на результаты автоматического распознавания речевых команд / О. Н. Корсун и др. // Наука и образование: науч. изд-е МГТУ им. Н. Э. Баумана: электрон. журн. 2013. № 1. С. 103 – 114. URL: https://elibrary.ru/download/elibrary_ 19013201 22605111.pdf (дата обращения: 04.11.2017). 7. Бондарос Ю. Г., Иванов А. И., Тищенко А. А. Определение степени утомления оператора по экспоненте Ляпунова для его речи // Вестник компьютерных и информационных технологий. 2010. № 6. C. 22 – 30. 8. Исследование характеристик речи дикторов-пилотов с нарушениями слуха в интересах создания системы речевого управления летательным аппаратом / А. И. Иванов и др. // Медицина труда и промышленная экология. 2014. № 11. С. 40 – 45. 9. Экспериментальное исследование взаимосвязи характеристик речи и состояния слуха у летного состава с нейросенсорной тугоухостью: пилотное исследование / А. И. Иванов и др. // Медицина труда и промышленная экология. 2017. № 5. С. 58 – 62. 10. Rabiner L., Juang B. H. Fundamentals of Speech Recognition. Englewood Cliffs, New Jersey: Prentice – Hall International, Inc. 1993. 507 p. 11. Корсун О. Н., Габдрахманов А. Ш. Распознавание речевых команд на основе использования стационарных соотношений с эталонами «чужих» слов // Вестник компьютерных и информационных технологий. 2017. № 1. С. 10 – 15. 12. Вентцель Е. С. Теория вероятностей. М.: Высшая школа, 1999. 576 c. 13. Корсун О. Н., Михайлов Е. И. Метод выделения речевого сигнала, основанный на технологии контрольных карт // Вестник компьютерных и информационных технологий. 2017. № 9. C. 24 – 31. 14. Корсун О. Н., Полиев А. В. Автоматическое выделение фонетически однородных участков в словах естественного языка на основе многопараметрической оптимизации // Изв. РАН. Теория и системы управления. 2016. № 4. С. 115 – 124.
1. Bondaros Iu. G. (2009). Speech signals operators research, critical for safety systems. Vestnik komp'iuternykh i informatsionnykh tekhnologii, (11), pp. 2-11. [in Russian language] 2. Bondaros Iu. G., Makovkin K. A., Chuchupal V. Ia. (2007). The system of recognition of voice commands in pilot's interface for integrated modular avionics. Vestnik komp'iuternykh i informatsionnykh tekhnologii, (4), pp. 2-13. [in Russian language] 3. Korsun O. N., Lavrova G. A., Sebriakov G. G. (2011). Synthesis of 3D-audio signals to audio interface of perspective cabin of the aircraft. Proceedings of the All-Russian scientific and technical conference «Simulation of the Aircraft Systems». Vol. 3, (pp. 452-458). Moscow. [in Russian language] 4. Korsun O. N., Gabdrakhmanov A. Sh. (2014). Noise resistant algorithm of voice control of aircraft equipment. Vestnik komp'iuternykh i informatsionnykh tekhnologii, (4), pp. 3-7. doi: 10.14489/vkit.2014.04. pp.003-007 [in Russian language] 5. Hirsch H.-G., Pearce D. (2000). The Aurora experimental framework for the performance evaluation of speech recognition systems under noisy conditions. ASR2000 – Automatic Speech Recognition, (1), pp. 181- 188. 6. Korsun O. N. et al. (2013). Experimental research on the effect of acoustic noises of different types on the results of automatic recognition of speech commands. Nauka i obrazovanie: elektronnoe nauchno-tekhnicheskoe izdanie, (1). Available at: http://technomag.edu.ru/doc/508614.html (Accessed: 09.09.2016). doi: 10.7463/0113.0508614 [in Russian language] 7. Bondaros Iu. G., Ivanov A. I., Tishchenko A. A. (2010). Operator fatigue degree definition according his voice Lyapunov exponent. Vestnik komp'iuternykh i informatsionnykh tekhnologii, (6), pp. 22-30. [in Russian language] 8. Ivanov A. I. et al. (2014). The study of speech characteristics of speakers pilots with hearing impairments in order to create a voice control system to control onboard equipment of the aircraft. Meditsina truda i promyshlennaia ekologiia, (11), pp. 40-45. [in Russian language] 9. Ivanov A. I. et al. (2017). Experimental study of the interrelation between the characteristics of speech and the state of hearing in flight formations with sensorineural hearing loss: pilot study. Meditsina truda i promyshlennaia ekologiia, (5), pp. 58-62. [in Russian language] 10. Rabiner L., Juang B. H. (1993). Fundamentals of speech recognition. Englewood Cliffs, New Jersey: Prentice – Hall International, Inc. 11. Korsun O. N., Gabdrakhmanov A. Sh. (2017). Speech recognition based on relations with аll the patterns in the dictionary. Vestnik komp'iuternykh i informatsionnykh tekhnologii, (1), pp. 10-15. doi: 10.14489/vkit.2017.01.pp.010-015 [in Russian language] 12. Venttsel' E. S. (2000). Theory of probability and its engineering applications. Moscow: Vysshaia shkola. [in Russian language] 13. Korsun O. N., Mikhailov E. I. (2017). The method for speech detection based on control charts techniques. Vestnik komp'iuternykh i informatsionnykh tekhnologii, (9), pp. 24-31. doi: 10.14489/vkit.2017.09. pp.024-031 [in Russian language] 14. Korsun O. N., Poliev A. V. (2016). Automatic selection of phonetically homogeneous areas in the words of natural language based on multiparameter optimization. Izvestiia RAN. Teoriia i sistemy upravleniia, (4), pp. 115-124. doi: 10.7868/S0002338816040089 [in Russian language]
Статью можно приобрести в электронном виде (PDF формат).
Стоимость статьи 350 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке.
После поступления денег на счет издательства, вам будет выслан электронный вариант статьи.
Для заказа скопируйте doi статьи:
10.14489/vkit.2018.01.pp.014-023
и заполните форму
Отправляя форму вы даете согласие на обработку персональных данных.
.
This article is available in electronic format (PDF).
The cost of a single article is 350 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank.
After depositing your payment on our bank account we send you file of the article by e-mail.
To order articles please copy the article doi:
10.14489/vkit.2018.01.pp.014-023
and fill out the form
.
|