基于深度强化学习与自学习的多无人机近距空战机动策略生成算法

孔维仁; 周德云; 赵艺阳; 杨婉莎

首页> 中文期刊> 《控制理论与应用》 >基于深度强化学习与自学习的多无人机近距空战机动策略生成算法

基于深度强化学习与自学习的多无人机近距空战机动策略生成算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为解决多无人机近距空战机动决策问题,提出一种基于参数共享Q网络与虚拟自我对局的多无人机近距空战机动策略生成算法.首先,设计一种适用于不同无人机编队规模的混合马尔可夫博弈模型与多无人机机动决策策略生成强化学习框架—参数共享Q网络,并通过自编码器对状态空间进行压缩以提高策略学习效率.然后,使用虚拟自我对局方法使机动策略收敛至纳什均衡策略.最后对自编码器的参数选择、策略生成算法的训练过程与机动策略的合理性与迁移性进行了仿真实验.通过仿真结果表明,引入自编码器可以有效地提高策略学习效率,并且使用该算法生成的多无人机近距空战机动策略具有合理性与良好的迁移性.

著录项

来源
《控制理论与应用》 |2022年第2期|352-362|共11页
作者
孔维仁; 周德云; 赵艺阳; 杨婉莎;
展开▼
作者单位

西北工业大学电子信息学院;

悉尼大学计算机学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算技术、计算机技术;
关键词
空战决策; 多无人机协同; 强化学习; 虚拟自我对局;

相似文献

中文文献
外文文献
专利

1. 基于强化学习的无人机空战机动决策 [J] . 丁林静 ,杨啟明 . 航空电子技术 . 2018,第002期
2. 基于深度强化学习的多无人机电力巡检任务规划 [J] . 马瑞 ,欧阳权 ,吴兆香 . 计算机与现代化 . 2022,第1期
3. 基于深度强化学习的多无人机任务动态分配 [J] . 唐峯竹 ,唐欣 ,李春海 . 广西师范大学学报（自然科学版） . 2021,第006期
4. 基于QPSO的模糊策略博弈的多无人机空战策略 [J] . 赵明明 ,陶翔 ,李恒 . 兵工自动化 . 2021,第005期
5. 基于深度随机博弈的近距空战机动决策 [J] . 马文 ,李辉 ,王壮 . 系统工程与电子技术 . 2021,第002期
6. 无人机空战时的机动准则与机动策略研究 [C] . 谢明 ,谢军 ,陈洪长 . 中国航空学会控制与应用第十二届学术年会 . 2006
7. 基于遗传算法和深度强化学习的多无人机协同区域监视的航路规划 [A] . 李艳庆 . 2018

基于深度强化学习与自学习的多无人机近距空战机动策略生成算法

摘要

著录项

相似文献

相关主题

期刊订阅