示教知识辅助的无人机强化学习控制算法

孙丹; 高东; 郑建华; 韩鹏

首页> 中文期刊> 《北京航空航天大学学报》 >示教知识辅助的无人机强化学习控制算法

示教知识辅助的无人机强化学习控制算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对强化学习(RL)应用于无人机自主控制中学习效率低的问题,结合示教学习利用专家经验对其进行改进,提出基于示教知识辅助的无人机RL控制算法。通过设立示教目标函数、修正值函数,将专家经验作为监督信号引入到策略更新中,实现专家经验对基于RL的无人机自主控制系统优化过程的引导,同时,设置专家经验样本缓存库,利用经验优先回放机制赋予经验样本不同的利用率,提高数据的使用效率。仿真结果表明:与普通的无人机RL控制器相比,所提算法能够在训练初期快速获得奖励值,整个学习过程中获得的奖励值更高,学习到的控制策略的响应速度更快、准确性更高。示教知识的加入有效引导了算法的学习,提高了无人机自主控制系统的学习效率,同时,能够提高算法的性能,有利于学习到更好的控制策略。此外,示教知识的加入扩大了经验数据的种类,有利于促进算法的稳定性,使无人机自主控制系统对奖励函数的设置具有鲁棒性。

著录项

来源
《北京航空航天大学学报》 |2023年第6期|1424-1433|共10页
作者
孙丹; 高东; 郑建华; 韩鹏;
展开▼
作者单位

中国科学院国家空间科学中心;

中国科学院大学;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动控制;
关键词
强化学习; 专家示教; 无人机; 自主控制; 学习系统;

相似文献

中文文献
外文文献
专利

1. 基于改进强化学习的无人机规避决策控制算法 [J] . Tajmihir Islam Teethi ,卢虎 ,闵欢 . 探测与控制学报 . 2022,第3期
2. 基于深度强化学习的无人机辅助移动边缘计算系统能耗优化 [J] . 张广驰 ,何梓楠 ,崔苗 . 电子与信息学报 . 2023,第5期
3. 基于多智能体强化学习的无人机群室内辅助救援 [J] . 郭天昊 ,张钢 ,岳文渊 . 计算机系统应用 . 2022,第2期
4. 无蜂窝大规模MIMO中基于深度强化学习的无人机辅助通信与资源调度 [J] . 王朝炜 ,邓丹昊 ,王卫东 . 电子与信息学报 . 2022,第3期
5. 基于强化学习的智能超表面辅助无人机通信系统物理层安全算法 [J] . 胡浪涛 ,毕松姣 ,刘全金 . 电子与信息学报 . 2022,第7期
6. 手术示教系统在见习带教中应用的管理体会 [C] . 林卫红 ,包纯纯 ,吴辉 . 中华护理学会第2届国际手术室护理学术交流会议 . 2009
7. 专家知识辅助的强化学习研究及其在无人机路径规划中的应用 [A] . 王国芳 . 2017

示教知识辅助的无人机强化学习控制算法

摘要

著录项

相似文献

相关主题

期刊订阅