10.14489/vkit.2020.06.pp.048-056 |
DOI: 10.14489/vkit.2020.06.pp.048-056 Дубенко Ю. В. Аннотация. Рассмотрена проблема коллективного искусственного разума при решении задач интеллектуальными агентами во внешних средах, которые могут быть полностью или частично наблюдаемыми, детерминированными или стохастическими, эпизодическими или последовательными, статическими или динамическими, дискретными или непрерывными. Определены проблемы, возникающие при коллективном взаимодействии интеллектуальных агентов при решении класса задач, требующих координации действий целой группы агентов, в частности, задача обследования территории сложного инфраструктурного объекта в целях мониторинга. Проведен анализ обучения с подкреплением, дано описание иерархического обучения с подкреплением, представлены основные методы реализации обучения с подкреплением. Введено понятие макродействия агентами, интегрированными в группы. Выявлены основные проблемы, которые возникают при коллективном взаимодействии интеллектуальных агентов для решения поставленной задачи: расчет индивидуальных вознаграждений для каждого агента; проблемы координации агентов; применение макродействий агентами, интегрированными в группы; обмен опытом, сгенерированным различными агентами в рамках решения коллективной задачи. С математическим обоснованием даны описания модели многоагентного обучения с подкреплением, основные проблемы реализации данного подхода с учетом существующих решений, предлагаемых в англоязычных источниках. Сформулированы основные проблемы многоагентного обучения с подкреплением. Ключевые слова: многоагентные системы; машинное обучение; многоагентное обучение; обучение с подкреплением; иерархическое обучение с подкреплением; Q-обучение.
Dubenko Yu. V. Abstract. This paper is devoted to the problem of collective artificial intelligence in solving problems by intelligent agents in external environments. The environments may be: fully or partially observable, deterministic or stochastic, static or dynamic, discrete or continuous. The paper identifies problems of collective interaction of intelligent agents when they solve a class of tasks, which need to coordinate actions of agent group, e. g. task of exploring the territory of a complex infrastructure facility. It is revealed that the problem of reinforcement training in multi-agent systems is poorly presented in the press, especially in Russian-language publications. The article analyzes reinforcement learning, describes hierarchical reinforcement learning, presents basic methods to implement reinforcement learning. The concept of macro-action by agents integrated in groups is introduced. The main problems of intelligent agents collective interaction for problem solving (i. e. calculation of individual rewards for each agent; agent coordination issues; application of macro actions by agents integrated into groups; exchange of experience generated by various agents as part of solving a collective problem) are identified. The model of multi-agent reinforcement learning is described in details. The article describes problems of this approach building on existing solutions. Basic problems of multi-agent reinforcement learning are formulated in conclusion. Keywords: Multi-agent systems; Machine learning; Multi-agent learning; Reinforcement learning; Hierarchical reinforcement learning; Q-learning.
РусЮ. В. Дубенко (Кубанский государственный технологический университет, Краснодар, Россия) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript EngYu. V. Dubenko (Kuban State Technological University, Krasnodar, Russia) E-mail: Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
Рус1. Azhikodan A. R., Bhat A. G. K., Jadhav M. V. Stock Trading Bot Using Deep Reinforcement Learning // Innovations in Computer Science and Engineering. Singapore, 2019. P. 41 – 49. doi: 10.1007/978-981-10-8201-6_5 Eng1. Azhikodan A. R., Bhat A. G. K., Jadhav M. V. (2019). Stock Trading Bot Using Deep Reinforcement Learning. Innovations in Computer Science and Engineering, pp. 41 – 49. Singapore, doi: 10.1007/978-981-10-8201-6_5
РусСтатью можно приобрести в электронном виде (PDF формат). Стоимость статьи 350 руб. (в том числе НДС 18%). После оформления заказа, в течение нескольких дней, на указанный вами e-mail придут счет и квитанция для оплаты в банке. После поступления денег на счет издательства, вам будет выслан электронный вариант статьи. Для заказа скопируйте doi статьи: 10.14489/vkit.2020.06.pp.048-056 Отправляя форму вы даете согласие на обработку персональных данных. .
EngThis article is available in electronic format (PDF). The cost of a single article is 350 rubles. (including VAT 18%). After you place an order within a few days, you will receive following documents to your specified e-mail: account on payment and receipt to pay in the bank. After depositing your payment on our bank account we send you file of the article by e-mail. To order articles please copy the article doi: 10.14489/vkit.2020.06.pp.048-056 and fill out the
.
|