首页> 中文会议>中国自动化与信息技术研讨会暨2004年学术年会 >一类连续动作空间下的Q-learning

一类连续动作空间下的Q-learning

页面导航

摘要
著录项
相似文献
相关主题

摘要

提出一类连续状态与动作空间下的加权Q学习算法,应用改进的增长神经气算法动态构建径向基网络的隐含层,实现状态空间的自适应理解.在基于径向基网络实现的标准Q学习基础上,利用加权Q学习算法用以解决具有连续动作输出的控制问题.小车爬山控制的仿真实例验证了本文所提加权Q学习算法的有效性.

著录项

来源
《中国自动化与信息技术研讨会暨2004年学术年会》|2004年|72-78|共7页
会议地点北京
作者
程玉虎; 易建强; 赵冬斌;
展开▼
作者单位

中国图像图形学学会;

中国自动化学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类人工智能理论;
关键词
连续状态空间; 连续动作空间; 加权Q学习; 神经气算法; 径向基网络;

相似文献

中文文献
外文文献
专利

1. 一类连续状态与动作空间下的加权Q学习 [J] . 程玉虎 ,易建强 ,王雪松 . 电机与控制学报 . 2005,第006期
2. 连续空间中的一种动作加权行动者评论家算法 [J] . 刘全 ,章鹏 ,钟珊 . 计算机学报 . 2017,第006期
3. 一种用于连续动作空间的最小二乘行动者-评论家方法 [J] . 朱斐 ,刘全 ,傅启明 . 计算机研究与发展 . 2014,第003期
4. 一类G1连续的空间五次PH拟合曲线 [J] . 彭丰富 ,刘惠 . 计算机工程与应用 . 2017,第020期
5. 一类G1连续的空间五次PH曲线 [J] . 彭丰富 ,刘惠 . 桂林电子科技大学学报 . 2016,第006期
6. 多Agent在连续状态空间里的动作选择 [C] . 王浩 ,方宝富 ,王骋 . 第十四届中国神经网络学术会议 . 2004
7. 连续动作空间下的机器人多轴孔装配方法研究 [A] . 权威 . 2021

获取原文

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号