10.14489/vkit.2021.11.pp.047-052 |
DOI: 10.14489/vkit.2021.11.pp.047-052 Коновалов В. А. Аннотация. Проведена оценка перспектив применения парадигмы больших данных в социально-экономических системах через анализ факторов, отличающих ее от научных идей синтеза и декомпозиции данных. Дан анализ идеи извлечения знаний непосредственно из больших данных. Приведено сравнение подходов к извлечению знаний из больших данных: алгебраический и многомерный анализы данных, применяемые в системах OLAP (OnLine Analytical Processing). Для оценки результата извлечения знаний из больших данных предложено использовать научные критерии: достоверность и оперативность. Выделены основные цели извлечения знаний в социально-экономических системах: прогноз и поддержка принятия управленческих решений. Приведен анализ факторов, отличающих большие данные (объем, многообразие, скорость прироста данных), в приложении к исследованию социально-экономических систем. Обоснована целесообразность введения универсума в системы для обработки больших данных. Проведен анализ влияния свойств выборочных совокупностей из больших данных: неполноты, неоднородности и нерепрезентативности, на выбор математических методов обработки больших данных. Сделан вывод о необходимости системного, комплексного, осторожного подхода к выработке принципиальных решений социально-экономического характера при применении парадигмы больших данных в исследовании отдельных социально-экономических подсистем. Ключевые слова: большие данные; неполная выборка данных; неоднородность; нерепрезентативность; достоверность; оперативность; теория категорий.
Konovalov V. A. Abstract. The paper assesses the prospects for the application of the big data paradigm in socio-economic systems through the analysis of factors that distinguish it from the well-known scientific ideas of data synthesis and decomposition. The idea of extracting knowledge directly from big data is analyzed. The article compares approaches to extracting knowledge from big data: algebraic and multidimensional data analysis used in OLAP-systems (OnLine Analytical Processing). An intermediate conclusion is made about the advisability of dividing systems for working with big data into two main classes: automatic and non-automatic. To assess the result of extracting knowledge from big data, it is proposed to use well-known scientific criteria: reliability and efficiency. It is proposed to consider two components of reliability: methodical and instrumental. The main goals of knowledge extraction in socio-economic systems are highlighted: forecasting and support for making management decisions. The factors that distinguish big data are analyzed: volume, variety, velocity, as applied to the study of socio-economic systems. The expediency of introducing a universe into systems for processing big data, which provides a description of the variety of big data and source protocols, is analyzed. The impact of the properties of sample populations from big data: incompleteness, heterogeneity, and non-representativeness, the choice of mathematical methods for processing big data is analyzed. The conclusion is made about the need for a systemic, comprehensive, cautious approach to the development of fundamental decisions of a socio-economic nature when using the big data paradigm in the study of individual socio-economic subsystems. Keywords: Big data; Incomplete data sampling; Heterogeneity; Non-representativeness; Reliability; Timeliness; Category theory.
РусВ. А. Коновалов (ОАО «Курскрезинотехника», Курск, Россия) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript EngV. A. Konovalov (Open Joint-Stock Company “Kurskrezinotekhnika”, Kursk, Russia) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
Рус1. Синюк А. И., Яковлева Е. В. Краткий словарь основных логических понятий: учеб.-метод. пособие для преподавателей и студентов вузов. Нижнекамск: Изд-во Нижнекамского муниципального института, 2008. 39 с. Eng1. Sinyuk A. I., Yakovleva E. V. (2008). A short dictionary of basic logical concepts: a textbook for teachers and university students. Nizhnekamsk: Izdatel'stvo Nizhnekamskogo munitsipal'nogo instituta. [in Russian language]
РусСтатью можно приобрести в электронном виде (PDF формат). Стоимость статьи 450 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке. После поступления денег на счет издательства, вам будет выслан электронный вариант статьи. Для заказа скопируйте doi статьи: 10.14489/vkit.2021.11.pp.047-052 Отправляя форму вы даете согласие на обработку персональных данных. .
EngThis article is available in electronic format (PDF). The cost of a single article is 450 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank. After depositing your payment on our bank account we send you file of the article by e-mail. To order articles please copy the article doi: 10.14489/vkit.2021.11.pp.047-052 and fill out the
.
|