10.14489/vkit.2021.08.pp.022-028 |
DOI: 10.14489/vkit.2021.08.pp.022-028 Бутенко Ю. И., Строганов Ю. В., Квасников А. В., Славнов Н. В., Кокурина Н. В. Аннотация. Описаны роли разработчиков в речевом корпусе по исследованию вариативности произношения носителей русского языка. Показаны необходимость создания систем распознавания речи дикторов с выряженными нарушениями, а также важность исследования вариативности произношения слов разными дикторами с учетом региональных и индивидуальных особенностей речи и последующего создания речевого корпуса. Описана система разметки звучащей речи для исследования вариативности произношения носителей русского языка. Для работы с корпусом предусмотрены роли администратора, модератора, размечающего и аналитика. Перечислены права разработчиков в речевом корпусе, выделена роль модератора для контроля качества разметки. Ключевые слова: речевой корпус; диктор; вариативность произношения; разметка; разработчик; роль.
Butenko Yu. I., Stroganov Yu. V., Kvasnikov A. V., Slavnov N. V., Kokurina N. V. Abstract. The article describes the user roles in the speech corpus for studying pronunciation variability of native speakers in the Russian language. The need for systems of speech recognition of speakers with dialects and disabilities is stated. It is emphasized the need to study the pronunciation variability of pronunciation by different speakers, taking into account regional and individual speech characteristics. Subsequent creating a speech corpus as the basis for regional and individual speech recognition is discussed. The speech corpus being developed contains recordings of the same text fragments by different speakers. The system of audio speech markup for researching the pronunciation variability of native Russian speakers is described. The roles of administrator, moderator, marker and analyst are provided for working with the corpus. Each user rights in the speech corpus are described: the administrator is the role which has all possible rights in the system. The marker is the user whose main task is to mark up the audio recordings. Analyst is the user who can assess and process the data in the speech corpus. The necessity of the moderator’s role in controlling the quality of markup is proved by the fact that it’s mostly students who mark up the audio recordings. The information in the developed speech corpora is supposed to be useful for phonetic studies in linguistics and a database for oral speech recognition. Keywords: Speech corpus; Speaker; Pronunciation variation; Markup; Maker; Role.
РусЮ. И. Бутенко, Ю. В. Строганов, А. В. Квасников, Н. В. Славнов, Н. В. Кокурина (Московский государственный технический университет имени Н. Э. Баумана, Москва, Россия) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript EngYu. I. Butenko, Yu. V. Stroganov, A. V. Kvasnikov, N. V. Slavnov, N. V. Kokurina (Bauman Moscow State Technical University, Moscow, Russia) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
Рус1. Иванов В. В. Лингвистика третьего тысячелетия: Вопросы к будущему. М.: Языки славянской культуры, 2004. 208 с. Eng1. Ivanov V. V. (2004). Linguistics of the Third Millennium: Questions for the Future. Moscow: Yazyki slavyanskoy kul'tury. [in Russian language]
РусСтатью можно приобрести в электронном виде (PDF формат). Стоимость статьи 450 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке. После поступления денег на счет издательства, вам будет выслан электронный вариант статьи. Для заказа скопируйте doi статьи: 10.14489/vkit.2021.08.pp.022-028 Отправляя форму вы даете согласие на обработку персональных данных. .
EngThis article is available in electronic format (PDF). The cost of a single article is 450 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank. After depositing your payment on our bank account we send you file of the article by e-mail. To order articles please copy the article doi: 10.14489/vkit.2021.08.pp.022-028 and fill out the