| Русский Русский | English English |
   
Главная Archive
22 | 12 | 2024
10.14489/vkit.2021.08.pp.022-028

DOI: 10.14489/vkit.2021.08.pp.022-028

Бутенко Ю. И., Строганов Ю. В., Квасников А. В., Славнов Н. В., Кокурина Н. В.
РОЛИ РАЗРАБОТЧИКОВ В РЕЧЕВОМ КОРПУСЕ ВАРИАТИВНОСТИ ПРОИЗНОШЕНИЯ НОСИТЕЛЕЙ РУССКОГО ЯЗЫКА
(с. 22-28)

Аннотация. Описаны роли разработчиков в речевом корпусе по исследованию вариативности произношения носителей русского языка. Показаны необходимость создания систем распознавания речи дикторов с выряженными нарушениями, а также важность исследования вариативности произношения слов разными дикторами с учетом региональных и индивидуальных особенностей речи и последующего создания речевого корпуса. Описана система разметки звучащей речи для исследования вариативности произношения носителей русского языка. Для работы с корпусом предусмотрены роли администратора, модератора, размечающего и аналитика. Перечислены права разработчиков в речевом корпусе, выделена роль модератора для контроля качества разметки.

Ключевые слова:  речевой корпус; диктор; вариативность произношения; разметка; разработчик; роль.

 

Butenko Yu. I., Stroganov Yu. V., Kvasnikov A. V., Slavnov N. V., Kokurina N. V.
DEVELOPER ROLES IN THE SPEECH CORPUS FOR PRONUNCIATION VARIATION OF RUSSIAN SPEAKERS
(pp. 22-28)

Abstract. The article describes the user roles in the speech corpus for studying pronunciation variability of native speakers in the Russian language. The need for systems of speech recognition of speakers with dialects and disabilities is stated. It is emphasized the need to study the pronunciation variability of pronunciation by different speakers, taking into account regional and individual speech characteristics. Subsequent creating a speech corpus as the basis for regional and individual speech recognition is discussed. The speech corpus being developed contains recordings of the same text fragments by different speakers. The system of audio speech markup for researching the pronunciation variability of native Russian speakers is described. The roles of administrator, moderator, marker and analyst are provided for working with the corpus. Each user rights in the speech corpus are described: the administrator is the role which has all possible rights in the system. The marker is the user whose main task is to mark up the audio recordings. Analyst is the user who can assess and process the data in the speech corpus. The necessity of the moderator’s role in controlling the quality of markup is proved by the fact that it’s mostly students who mark up the audio recordings. The information in the developed speech corpora is supposed to be useful for phonetic studies in linguistics and a database for oral speech recognition.

Keywords: Speech corpus; Speaker; Pronunciation variation; Markup; Maker; Role.

Рус

Ю. И. Бутенко, Ю. В. Строганов, А. В. Квасников, Н. В. Славнов, Н. В. Кокурина (Московский государственный технический университет имени Н. Э. Баумана, Москва, Россия) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript  

Eng

Yu. I. Butenko, Yu. V. Stroganov, A. V. Kvasnikov, N. V. Slavnov, N. V. Kokurina (Bauman Moscow State Technical University, Moscow, Russia) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript  

Рус

1. Иванов В. В. Лингвистика третьего тысячелетия: Вопросы к будущему. М.: Языки славянской культуры, 2004. 208 с.
2. Рассел С., Норвиг П. Искусственный интеллект: современный подход. 2-е изд.: пер. с англ. М.: Издательский дом «Вильямс», 2006. 1408 с.
3. Люгер Д. Ф. Искусственный интеллект: стратегии и методы решения сложных проблем. М.: Издательский дом «Вильямс», 2003. 864 c.
4. Волошин В. Г. Компьютерная лингвистика. Сумы: Университетская книга, 2004. 382 с.
5. Бутенко Ю. И., Шостак И. В. Методологические аспекты распознавания речи на основе многомерной статистической теории // Нейрокомпьютеры: разработка, применение. 2018. № 2. С. 23 – 33.
6. Потапова Р. К., Потапов В. В. Речевая коммуникация: от звука к высказыванию. М.: Языки славянских культур, 2012. 416 с.
7. An Exclusive Look at How AI and Machine Learning Work at Apple [Электронный ресурс]. URL: https://www.wired.com/2016/08/an-exclusive-look-at-how-ai-and-machine-learning-work-at-apple/ (дата обра¬щения: 01.11.2020).
8. Let՚s talk Microsoft, Neural Networks and Natural Language Processing for AI [Электронный ресурс]. URL: https://www.windowscentral.com/neural-networks-and-natural-language-processing-what-are-they-and-micro-soft (дата обращения: 25.10.2020).
9. Как «Яндекс» создавал «Алису» [Электронный ресурс]. URL: https://vc.ru/future/26878-ya-alice (дата обращения: 01.11.2020).
10. Research Highlights Fears Technology Could Eradicate Regional Accents [Электронный ресурс]. URL: https://www.life.org.uk/news/technology-could-eradicate-regional-accents (дата обращения: 15.10.2020).
11. Бутенко Ю. И., Строганов Ю. В., Славнов Н. В., Квасников А. В. Система разметки звучащей речи для сравнительного анализа произношения в различных диалектах // Вестник Воронежского государственного университета. Сер. Системный анализ и информационные технологии. 2020. № 1. С. 168 – 176. DOI: https://doi.org/10.17308/sait.2020.1/2631
12. Бутенко Ю. И. Использование триграмм при автоматическом распознавании речи // Вестник НГУ. Сер. Лингвистика и межкультурная коммуникация. 2020. Т. 18, № 3. С. 5 – 15. DOI 10.25205/1818-7935-2020-18-3-5-15

Eng

1. Ivanov V. V. (2004). Linguistics of the Third Millennium: Questions for the Future. Moscow: Yazyki slavyanskoy kul'tury. [in Russian language]
2. Rassel S., Norvig P. (2006). Artificial Intelli-gence: A Modern Approach. 2nd ed. Moscow: Izdatel'skiy dom «Vil'yams». [in Russian language]
3. Lyuger D. F. (2003). Artificial Intelligence: Strategies and Methods for Solving Complex Problems. Moscow: Izdatel'skiy dom «Vil'yams». [in Russian language]
4. Voloshin V. G. (2004). Computational linguistics. Sumy: Universitetskaya kniga. [in Russian language]
5. Butenko Yu. I., Shostak I. V. (2018). Methodological aspects of speech recognition based on multivariate statistical theory. Neyrokomp'yutery: razrabotka, primenenie, (2), pp. 23 – 33. [in Russian language]
6. Potapova R. K., Potapov V. V. (2012). Verbal communication: from sound to utterance. Moscow: Yazyki slavyanskih kul'tur. [in Russian language]
7. An Exclusive Look at How AI and Machine Learning Work at Apple. Available at: https://www.wired.com/2016/08/an-exclusive-look-at-how-ai-and-machine-learning-work-at-apple/ (Accessed: 01.11.2020).
8. Let՚s talk Microsoft, Neural Networks and Natural Language Processing for AI. Available at: https:// www.windowscentral.com/neural-networks-and-natural-language-processing-what-are-they-and-micro-soft (Accessed: 25.10.2020).
9. How Yandex created Alice. Available at: https:// vc.ru/future/26878-ya-alice (Accessed: 01.11.2020). [in Russian language]
10. Research Highlights Fears Technology Could Eradicate Regional Accents. Available at: https://www.life.org.uk/news/technology-could-eradicate-regional-accents (Accessed: 15.10.2020).
11. Butenko Yu. I., Stroganov Yu. V., Slavnov N. V., Kvasnikov A. V. (2020). Speech markup system for comparative analysis of pronunciation in different dialects. Vestnik Voronezhskogo gosudarstvennogo universiteta. Seriya: Sistemniy analiz i informatsionnye tekhnologii, (1), pp. 168 – 176. [in Russian language] DOI: https://doi.org/10.17308/sait.2020.1/2631
12. Butenko Yu. I. (2020). Using programs with automatic speech recognition. Vestnik NGU. Seriya: Lingvistika i mezhkul'turnaya kommunikatsiya, Vol. 18, (3), pp. 5 – 15. [in Russian language] DOI 10.25205/1818-7935-2020-18-3-5-15

Рус

Статью можно приобрести в электронном виде (PDF формат).

Стоимость статьи 450 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке.

После поступления денег на счет издательства, вам будет выслан электронный вариант статьи.

Для заказа скопируйте doi статьи:

10.14489/vkit.2021.08.pp.022-028

и заполните  форму 

Отправляя форму вы даете согласие на обработку персональных данных.

.

 

Eng

This article  is available in electronic format (PDF).

The cost of a single article is 450 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank.

After depositing your payment on our bank account we send you file of the article by e-mail.

To order articles please copy the article doi:

10.14489/vkit.2021.08.pp.022-028

and fill out the  form  

 

.

 

 

 
Search
Rambler's Top100 Яндекс цитирования