基于改进DDPG的空战行为决策方法

殷宇维; 王凡; 吴奎; 胡剑秋

首页> 中文期刊> 《指挥控制与仿真》 >基于改进DDPG的空战行为决策方法

基于改进DDPG的空战行为决策方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对空战中飞机如何根据实时态势进行快速智能决策问题,提出基于改进DDPG算法的空战行为决策框架(Air Combat Behavior Decision-making Framework on Improve DDPG,ACBDF_DDPG)。框架中的主要改进如下:1.设计一种针对动态目标的嵌入式人工经验奖励机制,缓解深度强化学习算法在训练过程中,由于状态空间巨大且奖励稀疏导致的收敛困难问题;2.对框架中的Actor网络更新机制进行改进,解决Critic网络评估效果差时,更新Actor网络导致的模型训练不稳定问题;3.采用优先采样机制确保训练价值高的经验样本得到充分利用。最后基于MaCA平台搭建仿真实验环境,通过消融实验验证了所提出框架中改进机制的有效性和优越性。

著录项

来源
《指挥控制与仿真》 |2022年第1期|97-102|共6页
作者
殷宇维; 王凡; 吴奎; 胡剑秋;
展开▼
作者单位

江苏自动化研究所;

江苏连云港222061;

展开▼
原文格式 PDF
正文语种 chi
中图分类军事数学;
关键词
深度强化学习; 深度确定性策略梯度; 空战行为决策; 动态目标; 嵌入式人工经验奖励机制;

相似文献

中文文献
外文文献
专利

1. 基于改进DDPG算法的车辆低速跟驰行为决策研究 [J] . 罗颖 ,秦文虎 ,翟金凤 . 测控技术 . 2019,第009期
2. 基于Q-学习和行为树的CGF空战行为决策 [J] . 方君 ,闫文君 ,邓向阳 . 计算机与现代化 . 2017,第005期
3. 基于改进组合拍卖算法的分布式空战攻击决策 [J] . 顾佼佼 ,周曰建 ,付鹏飞 . 兵工自动化 . 2019,第005期
4. 基于改进共生生物搜索算法的空战机动决策 [J] . 高阳阳 ,余敏建 ,韩其松 . 北京航空航天大学学报 . 2019,第003期
5. 基于改进粒子群算法的协同多目标攻击空战决策 [J] . 郭辉 ,徐浩军 ,谷向东 . 火力与指挥控制 . 2011,第006期
6. 基于矩阵博弈的空战决策方法 [C] . Qian wei-qi ,钱炜祺 ,Che Jing . 第二届中国指挥控制大会 . 2014
7. 基于DSM的空战效能仿真决策行为建模方法研究 [A] . 何磊 . 2014

基于改进DDPG的空战行为决策方法

摘要

著录项

相似文献

相关主题

期刊订阅