基于多智能体强化学习的轨道追逃博弈方法

许旭升; 党朝辉; 宋斌; 袁秋帆; 肖余之

首页> 中文期刊> 《上海航天(中英文)》 >基于多智能体强化学习的轨道追逃博弈方法

基于多智能体强化学习的轨道追逃博弈方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对空间轨道博弈过程中的集群卫星和非合作目标追逃博弈情形下的动力学模型复杂、非合作目标机动信息未知,以及卫星间难以有效协调等问题,提出一种基于多智能体深度强化学习算法的集群卫星空间轨道追逃博弈方法。首先通过对博弈场景进行建模,在考虑最短时间、最优燃料以及碰撞规避的情形下进行奖励函数的塑造和改进,利用深度强化学习方法中的多智能体深度确定性策略梯度(MADDPG)算法进行集中训练,得到各个追捕卫星和逃逸卫星的最优追逃策略参数;然后分布式执行使得多个追捕卫星和逃逸卫星之间能够完成追逃博弈。仿真结果表明:该方法能够完成集群卫星对非合作目标的追逃博弈,且能够利用数量优势有效地弥补速度劣势,涌现出“围捕“”拦截“”合作“”潜伏”等一系列智能博弈行为,有效地实现了博弈目的。

著录项

来源
《上海航天(中英文)》 |2022年第2期|24-31|共8页
作者
许旭升; 党朝辉; 宋斌; 袁秋帆; 肖余之;
展开▼
作者单位

上海宇航系统工程研究所;

西北工业大学航天学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类基础理论;
关键词
集群卫星; 非合作目标; 追逃博弈; 奖励塑造; 多智能体深度确定性策略梯度算法; 涌现; 智能;

相似文献

中文文献
外文文献
专利

1. 基于序贯博弈多智能体强化学习的综合模块化航空电子系统重构方法 [J] . 张涛 ,张文涛 ,代凌 . 电子学报 . 2022,第4期
2. 一种棋类计算机博弈强化学习智能体的决策依据解释方法 [J] . 刘贺 ,张小川 ,刁志东 . 重庆理工大学学报（自然科学版） . 2021,第012期
3. 一种棋类计算机博弈强化学习智能体的决策依据解释方法 [J] . 刘贺 ,张小川 ,刁志东 . 重庆理工大学学报 . 2021,第012期
4. 基于多智能体强化学习的混合博弈模式下多无人机辅助通信系统设计 [J] . 吴官翰 ,贾维敏 ,赵建伟 . 电子与信息学报 . 2022,第3期
5. 基于多智能体深度强化学习的空战博弈对抗策略训练模型 [J] . 孙彧 ,李清伟 ,徐志雄 . 指挥信息系统与技术 . 2021,第002期
6. 一种多智能体分层强化学习方法 [C] . 沈晶 ,程晓北 ,刘海波 . 中国人工智能学会第12届全国学术年会 . 2007
7. 近地轨道上两航天器追逃对策及数值求解方法研究 [A] . 孙松涛 . 2015

基于多智能体强化学习的轨道追逃博弈方法

摘要

著录项

相似文献

相关主题

期刊订阅