10.14489/vkit.2023.05.pp.011-019 |
DOI: 10.14489/vkit.2023.05.pp.011-019 Шадский В. В., Сизоненко А. Б. Аннотация. В соответствии с проведенным исследованием способов функционирования основанной на сигнатурных методах подсистемы контентного анализа документов систем предотвращения утечек информации разработаны и представлены ее структурно-функциональная и математическая модели. Формализованы условия достижения максимального значения показателя качества классификации данной подсистемы, выделены ее основные недостатки, в том числе проявляемые при осуществлении инсайдерского деструктивного воздействия на защищаемую информацию. Приведено обоснование необходимости использования в процессе анализа контента интеллектуальных методов. В качестве технического решения, расширяющего функционал основанной на сигнатурных методах подсистемы контентного анализа документов, предложен модуль интеллектуального анализа неструктурируемых текстовых данных, позволяющий осуществлять бинарную классификацию неструктурируемых текстовых данных минимального объема по степени конфиденциальности с соблюдением заданного порога качества классификации. Вербально описаны и формализованы предъявляемые к процессу функционирования данного модуля требования. В рамках создания модуля сформулирована и представлена задача двухэтапной оптимизации, заключающаяся в максимизации его функции эффективности. Ключевые слова: DLP-система; подсистема контентного анализа документов; сигнатурный анализ; модуль интеллектуального анализа неструктурируемых текстовых данных.
Shadskij V. V., Sizonenko A. B. Abstract. In this article, in accordance with the conducted research of the ways of functioning of the subsystem of content analysis of documents of information leakage prevention systems based on signature methods, its structural-functional and mathematical models are developed and presented. The conditions for achieving the maximum value of the classification quality index of this subsystem are formalized, its main disadvantages are highlighted, including those manifested in the implementation of insider destructive influence on protected information. The justification of the need to use intelligent methods in the process of content analysis is given. As a technical solution that expands the functionality of the subsystem of content analysis of documents based on signature methods, a module for intelligent analysis of unstructured text data is proposed, which allows binary classification of unstructured text data of minimal volume according to the degree of confidentiality in compliance with a given classification quality threshold. The requirements for the functioning of this module are verbally described and formalized. As part of the creation of the module, the task of two-stage optimization is formulated and presented, which consists in maximizing its efficiency function. Keywords: DLP-system; Subsystem of content analysis of documents; Signature analysis; Module of intellectual analysis of unstructured text data.
РусВ. В. Шадский, А. Б. Сизоненко (Краснодарское высшее военное училище имени генерала армии С. М. Штеменко, Краснодар, Россия) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript EngV. V. Shadskij, A. B. Sizonenko (Krasnodar Higher Military School named after the General of the Army S. M. Shtemenko, Krasnodar, Russia) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
Рус1. Отчет об утечках данных за 1-е полугодие 2022 года // InfoWatch. [Электронный ресурс]. URL: https://www.infowatch.ru/sites/default/files/analytics/files/otchyot-ob-utechkakh-dannykh-za-1-polugodie-2022-goda_1.pdf (дата обращения: 15.12.2022). Eng1. Data leakage report for the 1st half of the year 2022. InfoWatch. Available at: https://www.infowatch.ru/sites/default/files/analytics/files/otchyot-ob-utechkakh-dannykh-za-1-polugodie-2022-goda_1.pdf (Accessed: 15.12.2022). [in Russian language]
РусСтатью можно приобрести в электронном виде (PDF формат). Стоимость статьи 500 руб. (в том числе НДС 20%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке. После поступления денег на счет издательства, вам будет выслан электронный вариант статьи. Для заказа скопируйте doi статьи: 10.14489/vkit.2023.05.pp.011-019 Отправляя форму вы даете согласие на обработку персональных данных. .
EngThis article is available in electronic format (PDF). The cost of a single article is 500 rubles. (including VAT 20%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank. After depositing your payment on our bank account we send you file of the article by e-mail. To order articles please copy the article doi: 10.14489/vkit.2023.05.pp.011-019 and fill out the
.
|