| Русский Русский | English English |
   
Главная Архив номеров
20 | 04 | 2024
10.14489/vkit.2015.01.pp.031-036

DOI: 10.14489/vkit.2015.01.pp.031-036

Абишев Х. С., Зельманский О. Б.
ИССЛЕДОВАНИЕ ЧАСТОТЫ УПОТРЕБЛЕНИЯ БУКВ КАЗАХСКОГО АЛФАВИТА И СЛОВ КАЗАХСКОГО ЯЗЫКА ДЛЯ СИСТЕМ СИНТЕЗА РЕЧЕПОДОБНЫХ СИГНАЛОВ
(с. 31-36)

Аннотация. Представлены результаты исследования частоты употребления букв казахского алфавита и слов казахского языка на при-мере анализа казахско-русского словаря, технических и газетных текстов, а также произведений казахской художественной ли-тературы. Показано, что в казахском языке преимущественно используются трехслоговые и двухслоговые слова, а полученные результаты согласуются с положениями закона Зипфа.

Ключевые слова: статистика казахского языка; частота употребления букв казахского алфавита; встречаемость слов казахского языка; речеподобные сигналы.

 

Abishev H. S., Zelmanski O. B.
A STUDY OF KAZAKH LETTER AND KAZAKH WORD FREQUENCY ANALYSIS FOR SPEECHLIKE SIGNAL SYNTHESIZER
(pp. 31-36)

Abstract. Frequency analysis of Kazakh language is conducted on the Kazakh-Russian dictionary providing input of more than 50 000 words in total as well as on technical, news media and literature texts to get a fairly stable distribution of Kazakh letter frequency analysis. Investigation of the usage of Kazakh words is carried out using scientific publications which contain about 20 000 words. It is obtained that three syllable words (up to 30,3 %) and two syllable words (up to 23,1 %) are primarily used in Kazakh language. The obtained statistic is compared with statistic received by analysis of all letters in technical sources and artistic literature. It is shown that there is difference between statistics gained by analysis of only capital letters and all letters. There is also difference in letter frequency between technical text and artistic literature. It is stated that the most appropriate statistic for speech synthesis is statistic gained by analysis of only capital letters of the Kazakh-Russian dictionary. According to this statistic allophone databases for speechlike noise synthesis are formed. These databases include different variants of all Kazakh letters pronunciation with their frequencies. Speechlike noise synthesis is based on the compilation of allophones from these allophone databases. The obtained result can be used for generating phonetic text that will be sounded using compilation of allophones. Such speechlike noise can be used for masking acoustic information in information security systems. The main advantage of utilizing speechlike noise compared to white noise is that the level of speechlike noise can be 6 – 8 dB less. This is more comfortable for personnel.

Keywords: 

Рус

Х. С. Абишев, О. Б. Зельманский (Белорусский государственный университет информатики и радиоэлектроники, Минск) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript  

Eng

H. S. Abishev, O. B. Zelmanski (Belarusian State University of Informatics and Radioelectronics, Minsk) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript  

Рус

1. Киселев В. В., Лобанов Б.М. Система синтеза русской речи на основе компиляционного метода // Докл. БГУИР. № 4. 2004. С. 133 – 137.
2. Активные и пассивные методы и средства за-щиты информации от утечки по техническим каналам / М. О. Аль-Хатми и др. Минск: Бестпринт, 2011. 275 с.
3. Воробьев В. И., Давыдов А. Г., Лобанов Б. М. Синтез речеподобных сигналов с использованием алло-фонов // Cб. тр. XIII сессии Российского акустического общества, Москва, 25 – 29 августа 2003 г. М.: ГЕОС, 2003. Т. 3. С. 110 – 114.
5. Сыздық Р. С. Казахско-русский словарь. Алма-ты: Дайк-пресс, 2002. 1008 с.
6. Zipf G. Selective Studies and the Principle of Relative Frequency in Language // Cambridge, Mass. 1932.

Eng

1. Kiselev V. V., Lobanov B.M. (2004). The system of Russian speech synthesis based on compilation meth-od. Doklady BGUIR, (4), pp. 133-137.
2. Al'-Khatmi M. O., Zel'manskii O. B., Lyn'kov L. M., Petrov S. N. (2011). Active and passive methods and means of information protection from leakage through technical channels: monograph. Minsk: Bestprint.
3. Vorob'ev V. I., Davydov A. G., Lobanov B. M. (2003). Synthesis of speech-like signals using allophones. Proceedings of the XIII session of Russian acoustic commu-nity. Nizhnii Novgorod, 25 – 29 August 2003, Vol. 3, Mos-cow: GEOS, pp. 110-114.
5. Syzdyk R. S. (2002). Kazakh-Russian dictionary. Almaty: Daik-press.

Рус

Статью можно приобрести в электронном виде (PDF формат).

Стоимость статьи 250 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке.

После поступления денег на счет издательства, вам будет выслан электронный вариант статьи.

Для заказа статьи заполните форму:

{jform=1,doi=10.14489/vkit.2015.01.pp.031-036}

.

Eng

This article  is available in electronic format (PDF).

The cost of a single article is 250 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank.

After depositing your payment on our bank account we send you file of the article by e-mail.

To order articles please fill out the form below:

{jform=2,doi=10.14489/vkit.2015.01.pp.031-036}

 

 

 

 

 

.

.

 

 
Поиск
Баннер
Баннер
Rambler's Top100 Яндекс цитирования