基于深度强化学习的多无人艇协同目标搜索算法

邢博闻; 张昭夷; 王世明; 娄嘉奕; 王五桂

首页> 中文期刊> 《兵器装备工程学报》 >基于深度强化学习的多无人艇协同目标搜索算法

基于深度强化学习的多无人艇协同目标搜索算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对应用于海上多无人艇目标搜索任务的经典深度强化学习模型难以收敛且训练耗时长的问题,提出一种基于优先经验回放的异步确定性策略梯度模型。为提升模型收敛效果,引入一种基于优先级的经验回放机制,该机制可以有效提高高价值经验的利用率,从而避免算法收敛困难的问题。为进一步减少模型训练耗时长,引入异步学习的训练框架,该框架通过多子线程的同步训练参数更新主进程网络,有效提高了模型训练效率。在MPE仿真环境对提出的PA-MADDPG算法与MADDPG、MAPPO和PER-MADDPG算法进行对比实验,结果表明:提出模型在1000~1200回合就达到收敛,经过1000回合左右训练智能体总碰撞次数就趋于0,相较于其他算法任务成功率提高了5%~10%。

著录项

来源
《兵器装备工程学报》 |2023年第11期|118-125|共8页
作者
邢博闻; 张昭夷; 王世明; 娄嘉奕; 王五桂;
展开▼
作者单位

上海海洋大学工程学院;

津泰海洋工程研究有限公司;

中国船舰研究设计中心;

展开▼
原文格式 PDF
正文语种 chi
中图分类船舶操纵控制系统;人工智能理论;
关键词
深度强化学习; 多无人艇; 多目标搜索; 优先经验回放; 异步学习;

相似文献

中文文献
外文文献
专利

1. 基于深度强化学习的多无人艇协同目标搜索算法 [J] . 邢博闻 ,张昭夷 ,王世明 . 兵器装备工程学报 . 2023,第11期
2. 基于深度强化学习的无人艇集群博弈对抗 [J] . 苏震 ,张钊 ,陈聪 . 兵器装备工程学报 . 2022,第9期
3. 基于深度强化学习的无人艇控制研究 [J] . 李宝安 . 中国造船 . 2020,第s01期
4. 基于深度强化学习的无人艇航行控制 [J] . 张法帅 ,李宝安 ,阮子涛 . 计测技术 . 2018,第a01期
5. 基于深度强化学习的无人机集群协同作战决策方法 [J] . 赵琳 ,吕科 ,郭靖 . 计算机应用 . 2023,第11期
6. 基于深度强化学习的无人艇航行控制 [C] . 张法帅 ,李宝安 ,阮子涛 . 2018 年计量测试技术交流会 . 2018
7. 基于深度强化学习的无人艇航迹控制的研究 [A] . 李浩东 . 2022

基于深度强化学习的多无人艇协同目标搜索算法

摘要

著录项

相似文献

相关主题

期刊订阅