基于强化学习的多无人飞行器避碰决策方法

杨艳飞; 诸燕平; 胡灿; 张斌

首页> 中文期刊> 《电光与控制》 >基于强化学习的多无人飞行器避碰决策方法

基于强化学习的多无人飞行器避碰决策方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

随着低空空域环境的日益复杂,执行任务的无人飞行器间发生冲突的概率不断增加。针对传统强化学习算法SAC,DDPG在解决有限空域内多无人飞行器间的避碰问题上存在收敛速度慢、收敛不稳定等缺陷,提出了一种基于PPO2算法的多智能体强化学习(MARL)方法。首先,将多无人飞行器飞行决策问题描述为马尔可夫决策过程;其次,设计状态空间与奖励函数,通过最大化累计奖赏来优化策略,使整体训练更加稳定、收敛更快;最后,基于深度学习TensorFlow框架和强化学习Gym环境搭建飞行模拟场景,进行仿真实验。实验结果表明,所提方法相较于基于SAC和DDPG算法的方法,避碰成功率分别提高约37.74和49.15个百分点,能够更好地解决多无人飞行器间的避碰问题,在收敛速度和收敛稳定性方面更优。

著录项

来源
《电光与控制》 |2023年第9期|112-118|共7页
作者
杨艳飞; 诸燕平; 胡灿; 张斌;
展开▼
作者单位

常州大学计算机与人工智能学院;

常州大学微电子与控制工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类飞行控制系统与导航;
关键词
无人飞行器; 深度强化学习(DRL); 多智能体; 避碰; PPO2;

相似文献

中文文献
外文文献
专利

1. 基于强化学习的多无人机避碰计算制导方法 [J] . 赵毓 ,郭继峰 ,郑红星 . 导航定位与授时 . 2021,第1期
2. 基于驾驶实践的无人船智能避碰决策方法 [J] . 丁志国 ,张新宇 ,王程博 . 中国舰船研究 . 2021,第1期
3. 基于海上避碰规则和机器学习的辅助避碰决策方法研究 [J] . 冯涂超 ,郑茂 ,尹奇志 . 武汉理工大学学报（交通科学与工程版） . 2021,第1期
4. 多个无人飞行器协同避障及避碰研究 [J] . 杨秀霞1 ,华伟2 ,孟启源2 . 兵器装备工程学报 . 2017,第10期
5. 基于Q-Learning的无人船智能避碰决策 [C] . 孙静海 . 大连海事大学第七届硕博论坛 . 2018
6. 基于多目标的无人艇避碰决策方法研究 [A] . 李笑莹 . 2017

基于强化学习的多无人飞行器避碰决策方法

摘要

著录项

相似文献

相关主题

期刊订阅