10.14489/vkit.2018.02.pp.036-045 |
DOI: 10.14489/vkit.2018.02.pp.036-045 Аникин В. И., Аникина О. В., Гущина О. М. Аннотация. Построена и исследована табличная итерационная компонентная модель алгоритма нечеткой кластеризации FCM (Fuzzy C-Means) в электронных таблицах, базирующаяся на пяти геометрических нормах расстояний между образцами данных: евклидовой, манхэттенской, Минковского, Маханалобиса, диагональной. Показано, что разработанная модель предоставляет пользователям широкие возможности для эффективной визуализации информационной структуры и особенностей работы алгоритма FCM за счет использования в электронных таблицах парадигмы распределенных вычислений и инструмента условного форматирования ячеек с формулами, играющими роль исполнительных узлов распределенного вычислителя. В модели использован механизм условного форматирования в электронных таблицах, реагирующий на изменения данных в каждой итерации, что позволяет визуализировать временнýю эволюцию табличной модели алгоритма (данных и графиков) в динамике, непосредственно в ходе выполнения итераций. Ключевые слова: нечеткая кластеризация; алгоритм Fuzzy C-Means; табличное моделирование; электронная таблица; визуализация алгоритмов.
Anikin V. I., Anikina O. V., Gushchina O. M. Abstract. A tabular iterative component model of the Fuzzy C-Means (FCM) algorithm was constructed and analyzed in spreadsheets. It is based on five geometric norms for the distances between the data samples: Euclidean, Manhattan, Minkowski, Mahanalobis, diagonal. The non-triviality of the FCM fuzzy clustering algorithm implementation in spreadsheets is as follows: 1) the table model is iterative and uses the nonstandard mode of multiple calculations in spreadsheets; 2) the algorithm is based on matrix calculations, so most of the components of the model contain two-dimensional data frames which are connected by means of the cyclic references. The developed model provides users with ample opportunities for efficient visualization of the information structure and features of the FCM algorithm. This is because of the use in the spreadsheets of the distributed computing paradigm and conditional cell formatting tools with formulas playing the role of execution nodes of the distributed calculator. The advantage of this model is the efficiency of visualization of the information and the structure of the fuzzy clustering algorithm in spreadsheets; even in comparison with such powerful mathematical modeling environments as MATLAB and R. In addition, the model uses Excel's conditional formatting mechanism, which allows it to react to data changes in each iteration. This allows you to visualize the temporal evolution of the table model of the algorithm (data and graphs) in dynamics directly during the iteration. The implemented iterative table model of the FCM algorithm can be effectively used in the laboratory practice of universities to demonstrate the principles of fuzzy clustering algorithms, as well as allowing programmers and application users to quickly test their creative ideas and their own data sets. Keywords: Fuzzy clustering; Fuzzy c-means clustering algorithm; Tabular modeling; Spreadsheet; Visualization of algorithms.
РусВ. И. Аникин (Поволжский государственный университет сервиса, Самарская область, Тольятти, Россия) E-mail:
Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
EngV. I. Anikin (Volga Region State University of Service, Samara region, Togliatti, Russia) E-mail:
Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
Рус
Eng1. Dunn J. C. (1973). A fuzzy relative of the ISODATA process and its use in detecting compact, wellseparated clusters. Journal Cybernet, 3(3), pp. 32-57. doi: 10.1080/01969727308546046
РусСтатью можно приобрести в электронном виде (PDF формат). Стоимость статьи 350 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке. После поступления денег на счет издательства, вам будет выслан электронный вариант статьи. Для заказа скопируйте doi статьи: 10.14489/vkit.2018.02.pp.036-045 Отправляя форму вы даете согласие на обработку персональных данных. .
EngThis article is available in electronic format (PDF). The cost of a single article is 350 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank. After depositing your payment on our bank account we send you file of the article by e-mail. To order articles please copy the article doi: 10.14489/vkit.2018.02.pp.036-045 and fill out the
.
|