10.14489/vkit.2023.05.pp.035-048 |
DOI: 10.14489/vkit.2023.05.pp.035-048 Коновалов В. А. Аннотация. Рассматриваются фонемы, морфемы, морфы и алломорфы слов искусственных языков для синтеза методики классификации типологий рисков отмывания доходов, полученных преступным путем, и финансирования терроризма в больших данных множества источников данных организационных систем. Решается теоретическая задача раскрытия механизма формирования категорий из слов, переработанных системой Маркова, для множества источников данных. Развиваются положения теории алгоритмов, касающиеся раскрытия свойств выходных данных, переработанных N-схемой алгоритма Маркова, разработанной на замену его известной g-схемы. Теоретически обосновывается способ формирования марковских фонем с использованием алфавита M = litjпо1…оx /abdgckm для входных выборок больших данных и алфавита MK = litj/abdgckm для канала управления. Синтезируются морфемы из марковских фонем. Исследуются свойства корней и аффиксов морфем с позиций теории алгоритмов, в частности в N-схеме алгоритма Маркова. Приведены результаты теоретического обоснования способа определения (задания) для морфем морфов и алломорфов. Установлены новые свойства марковских фонем в алфавитах Маркова AM±2 и KMK±2, ранее не замеченные в лингвистике. Разработана модель морфемы, подтвержден ее абстрактный характер, приведены способы синтеза морфов и алломорфов в категорном формате представления. Синтезировано высказывание в виде диаграммы вхождений Маркова, проведен ее всесторонний анализ. Выделение морфов с учетом источника данных обеспечивает представление высказываний в виде цепочек вхождений, которые можно перекодировать в категорный формат представления, а подвергая анализу номера-типы и номера морфизмов, можно из морфов выделить их сигнатуры – алломорфы. Ключевые слова: фонема; морфема; морф; алломорф; методика классификации типологий; большие данные; теория категорий; теория алгоритмов Маркова; искусственный интеллект.
Konovalov V. A. Abstract. For artificial languages formed by many sources of big data, in the Markov alphabet, a prescription is investigated that provides linkage between the word and the source, through the consideration of phonemes, morphemes, morphs and allomorphs in this language. The artificial language is studied in the context of solving the problem of synthesizing a methodology for classifying the risks of laundering proceeds from crime and financing terrorism in big data of organizational systems. New provisions of the theory of Markov algorithms are being developed. Methods of data decomposition using the N-scheme of the Markov algorithm, developed to replace his well-known g-scheme, are studied. A method for decomposing words into phonemes in the Markov alphabet is considered. It has been established that Markov phonemes are formed on the basis of terminal symbols of the alphabet M = litjпо1…оx /abdgckm for big data input samples and the alphabet MK = litj/abdgckm for the control channel. The method of synthesizing morphemes from Markov phonemes is studied from the positions of both the theory of algorithms and linguistics. The properties of roots and affixes of morphemes are considered from the standpoint of the theory of algorithms, in particular, in the N-scheme of the Markov algorithm. A scientific contradiction in the linguistic approach to the formation of morphemes is revealed, a way to overcome it is proposed. The results of the theoretical substantiation of the method of determining (assigning) for morphemes morphs and allomorphs within the framework of the theory of algorithms are given. New properties of Markov phonemes in the Markov alphabets AM±2 and KMK±2 not previously seen in linguistics are established. Some scientific conclusions previously obtained in linguistics are confirmed from the position of the theory of algorithms. A generalized, reference model of a morpheme has been developed, its abstract nature has been confirmed, methods for synthesizing morphs and allomorphs in a categorical representation format have been given. The statement is synthesized in the form of a Markov diagram of occurrences, its comprehensive analysis is carried out. It is concluded from the above research results that the decomposition of big data into phonemes and morphs provides the representation of statements in the form of chains of occurrences that can be recoded into a categorical presentation format, and by analyzing numbers-types and numbers of morphisms, it is possible to extract their signatures from morphs, which are allomorphs. Keywords: Phoneme; Morpheme; Morph; Allomorph; Methods of classification of typologies; Big data; Category theory; Theory of Markov algorithms; Artificial intelligence.
РусВ. А. Коновалов (ОАО «Курскрезинотехника», Курск, Россия) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript EngV. A. Konovalov (Open Joint-Stock Company “Kurskrezinotekhnika”, Kursk, Russia) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
Рус1. ГОСТ Р ИСО/МЭК 20546–2021. Информационные технологии. Большие данные. Обзор и словарь. Введ. 2021-01-11. М.: Стандартинформ, 2021. 21 с. Eng1. Information Technology. Big data. Overview and dictionary. (2021). Ru Standard No. GOST R ISO/MEK 20546–2021. Moscow: Standartinform. [in Russian language]
РусСтатью можно приобрести в электронном виде (PDF формат). Стоимость статьи 500 руб. (в том числе НДС 20%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке. После поступления денег на счет издательства, вам будет выслан электронный вариант статьи. Для заказа скопируйте doi статьи: 10.14489/vkit.2023.05.pp.035-048 Отправляя форму вы даете согласие на обработку персональных данных. .
EngThis article is available in electronic format (PDF). The cost of a single article is 500 rubles. (including VAT 20%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank. After depositing your payment on our bank account we send you file of the article by e-mail. To order articles please copy the article doi: 10.14489/vkit.2023.05.pp.035-048 and fill out the
.
|