双Q网络学习的迁移强化学习算法

曾睿; 周建; 刘满禄; 张俊俊; 陈卓

首页> 中文期刊> 《计算机应用研究》 >双Q网络学习的迁移强化学习算法

双Q网络学习的迁移强化学习算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

深度强化学习在训练过程中会探索大量环境样本,造成算法收敛时间过长,而重用或传输来自先前任务(源任务)学习的知识,对算法在新任务(目标任务)的学习具有提高算法收敛速度的潜力.为了提高算法学习效率,提出一种双Q网络学习的迁移强化学习算法,其基于actor-critic框架迁移源任务最优值函数的知识,使目标任务中值函数网络对策略作出更准确的评价,引导策略快速向最优策略方向更新.将该算法用于Open AI Gym以及在三维空间机械臂到达目标物位置的实验中,相比于常规深度强化学习算法取得了更好的效果,实验证明提出的双Q网络学习的迁移强化学习算法具有较快的收敛速度,并且在训练过程中算法探索更加稳定.

著录项

来源
《计算机应用研究》 |2021年第6期|1699-1703|共5页
作者
曾睿; 周建; 刘满禄; 张俊俊; 陈卓;
展开▼
作者单位

西南科技大学制造科学与工程学院四川绵阳621000;

西南科技大学特殊环境机器人技术四川省重点实验室四川绵阳621000;

西南科技大学特殊环境机器人技术四川省重点实验室四川绵阳621000;

西南科技大学信息工程学院四川绵阳621000;

西南科技大学特殊环境机器人技术四川省重点实验室四川绵阳621000;

西南科技大学信息工程学院四川绵阳621000;

西南科技大学制造科学与工程学院四川绵阳621000;

西南科技大学特殊环境机器人技术四川省重点实验室四川绵阳621000;

西南科技大学制造科学与工程学院四川绵阳621000;

西南科技大学特殊环境机器人技术四川省重点实验室四川绵阳621000;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
深度强化学习; 双Q网络学习; actor-critic框架; 迁移学习;

相似文献

中文文献
外文文献
专利

1. 基于强化学习的5G网络切片虚拟网络功能迁移算法 [J] . 唐伦 ,周钰 ,谭颀 . 电子与信息学报 . 2020,第003期
2. 迁移蚁群强化学习算法及其在矩形排样中的应用 [J] . 徐小斐 ,陈婧 ,饶运清 . 计算机集成制造系统 . 2020,第012期
3. 基于Agent强化学习的地图迁移学习算法 [J] . 张炎 ,刘博文 . 电子世界 . 2014,第015期
4. 一类基于谱方法的强化学习混合迁移算法 [J] . 朱美强 ,程玉虎 ,李明 . 自动化学报 . 2012,第011期
5. 基于双深度强化学习的切换算法分析 [J] . 董春利 ,王莉 . 无线互联科技 . 2021,第015期
6. 基于遗传算法的神经网络学习算法研究 [C] . 鲁小帆 ,郭嗣琮 ,董超 . 中国计量协会冶金分会2007年年会 . 2007
7. 基于深度强化学习的虚拟网络功能部署及迁移优化算法研究 [A] . 贺兰钦 . 2020

双Q网络学习的迁移强化学习算法

摘要

著录项

相似文献

相关主题

期刊订阅