协作多智能体深度强化学习研究综述

邹启杰; 蒋亚军; 高兵; 李文雪; 张汝波

首页> 中文期刊> 《航空兵器》 >协作多智能体深度强化学习研究综述

协作多智能体深度强化学习研究综述

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

多智能体系统是由多个智能体与环境交互组成的分布式决策系统,是分布式人工智能的一个重要研究方向,在复杂未知的现实社会具有广阔的应用前景,如工业、农业、军事和航空航天等群体机器人系统,以及交通控制、资源管理、商业金融和游戏AI等。多智能体强化学习(Multi-Agent Reinforcement Learning,MARL)依托强化学习在未知环境中的序贯决策能力,融合了运筹学、博弈论和群体心理学等众多学科,能够更好地发挥多个智能体的协同优势,进而低成本、高效率地完成复杂任务。本文着重针对无通信环境下的协作多智能体深度强化学习研究成果进行分析、对比和展望。首先,介绍了MARL的研究背景及其学习任务的分类。其次,根据MARL重点研究内容,将多智能体强化学习算法分为价值分解、 Actor-Critic和经验回放三个类别加以剖析,并从环境非平稳性、信度分配和收敛性能等不同角度对比算法差异性。最后,分析了MARL领域未来研究所面临的一些挑战,并对MARL的应用和前景进行展望。

著录项

来源
《航空兵器》 |2022年第6期|78-88|共11页
作者
邹启杰; 蒋亚军; 高兵; 李文雪; 张汝波;
展开▼
作者单位

大连大学信息工程学院;

大连民族大学机电工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类一般性问题;自动推理、机器学习;
关键词
多智能体; 深度学习; 强化学习; 协作学习; 价值分解; Actor-Critic; 经验回放;

相似文献

中文文献
外文文献
专利

1. 多智能体深度强化学习研究综述 [J] . 孙彧 ,曹雷 ,陈希亮 . 计算机工程与应用 . 2020,第005期
2. 基于值分解的多智能体深度强化学习综述 [J] . 熊丽琴 ,曹雷 ,赖俊 . 计算机科学 . 2022,第9期
3. 增强协作多智能体强化学习中的全局信用分配机制 [J] . 姚兴虎 ,宋光鑫 . 计算技术与自动化 . 2021,第001期
4. 基于多智能体深度强化学习的大规模交通信号灯控制模型研究 [J] . 陈骁 . 工业仪表与自动化装置 . 2022,第4期
5. 基于深度强化学习的智能体在智慧消防中的应用研究 [J] . 牛浩玉 ,汤文兵 ,田锦 . 通信技术 . 2019,第010期
6. 深度多智能体强化学习 [C] . 郝建业 . 2018中国大数据技术大会(BDTC） . 2018

协作多智能体深度强化学习研究综述

摘要

著录项

相似文献

相关主题

期刊订阅