10.14489/vkit.2021.11.pp.013-026 |
DOI: 10.14489/vkit.2021.11.pp.013-026 Дубенко Ю. В., Дышкант Е. Е., Тимченко Н. Н., Рудешко Н. А. Аннотация. Приведены гибридный алгоритм формирования кратчайшей траектории для интеллектуальных агентов многоагентной системы, основанный на синтезе методов парадигмы обучения с подкреплением, и эвристический поисковый алгоритм А*, обладающий функциями обмена опытом, а также автоматического формирования подгрупп агентов на основании их областей видимости. Экспериментальная оценка разработанного алгоритма осуществлялась путем моделирования задачи поиска целевого состояния в лабиринте в среде Microsoft Unity. Результаты эксперимента показали, что применение разработанного гибридного алгоритма позволило снизить время решения задачи в среднем на 12,7 % по сравнению с аналогами. Отличие предложенного нового «гибридного алгоритма формирования кратчайшей траектории, основанного на применении многоагентного обучения с подкреплением, поискового алгоритма A* и обмена опытом» от аналогов заключается, во-первых, в применении алгоритма формирования подгрупп агентов-подчиненных на основании «области видимости» агента-лидера для реализации многоуровневой иерархической системы управления группой агентов и, во-вторых, в объединении принципов обучения с подкреплением и поискового алгоритма А*. Ключевые слова: интеллектуальный агент; многоагентное обучение с подкреплением; эвристический алгоритм А*; область видимости агента; обмен опытом; формирование кратчайшей траектории; агент-менеджер; агент-подчиненный.
Dubenko Yu. V., Dyshkant E. E., Timchenko N. N., Rudeshko N. A. Abstract. The article presents a hybrid algorithm for the formation of the shortest trajectory for intelligent agents of a multi-agent system, based on the synthesis of methods of the reinforcement learning paradigm, the heuristic search algorithm A*, which has the functions of exchange of experience, as well as the automatic formation of subgroups of agents based on their visibility areas. The experimental evaluation of the developed algorithm was carried out by simulating the task of finding the target state in the maze in the Microsoft Unity environment. The results of the experiment showed that the use of the developed hybrid algorithm made it possible to reduce the time for solving the problem by an average of 12.7 % in comparison with analogs. The differences between the proposed new “hybrid algorithm for the formation of the shortest trajectory based on the use of multi-agent reinforcement learning, search algorithm A* and exchange of experience” from analogs are as follows: – application of the algorithm for the formation of subgroups of subordinate agents based on the “scope” of the leader agent for the implementation of a multi-level hierarchical system for managing a group of agents; – combining the principles of reinforcement learning and the search algorithm A*. Keywords: Intelligent agent; Multiagent reinforcement learning; Heuristic algorithm A*; Agent visibility; Exchange of experience; Formation of the shortest trajectory; Agent-manager; Agent-subordinate.
РусЮ. В. Дубенко, Е. Е. Дышкант, Н. Н. Тимченко, Н. А. Рудешко (Кубанский государственный технологический университет, Краснодар, Россия) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript EngYu. V. Dubenko, E. E. Dyshkant, N. N. Timchenko, N. A. Rudeshko (Kuban State Technological University, Krasnodar, Russia) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
Рус1. Дубенко Ю. В. Аналитический обзор проблем многоагентного обучения с подкреплением // Вестник компьютерных и информационных технологий. 2020. Т. 17, № 6(192). С. 48 – 56. Eng1. Dubenko Yu. V. (2020). Analytical overview of the problems of multi-agent reinforcement learning. Vestnik komp'yuternyh i informatsionnyh tekhnologiy, Vol. 17, 192(6), pp. 48 – 56. [in Russian language] DOI 10.14489/ vkit.2020.06.pp.048-056
РусСтатью можно приобрести в электронном виде (PDF формат). Стоимость статьи 450 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке. После поступления денег на счет издательства, вам будет выслан электронный вариант статьи. Для заказа скопируйте doi статьи: 10.14489/vkit.2021.11.pp.013-026 Отправляя форму вы даете согласие на обработку персональных данных. .
EngThis article is available in electronic format (PDF). The cost of a single article is 450 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank. After depositing your payment on our bank account we send you file of the article by e-mail. To order articles please copy the article doi: 10.14489/vkit.2021.11.pp.013-026 and fill out the
.
|