首页> 中文学位 >在线自组织动态模糊Q学习算法及在移动机器人实时路径规划中的应用
【6h】

在线自组织动态模糊Q学习算法及在移动机器人实时路径规划中的应用

代理获取

目录

文摘

英文文摘

第一章绪论

1.1移动机器人在非结构环境下的路径规划方法

1.2基于传感信息的模糊控制路径规划思路

1.3在线自组织动态模糊Q强化学习算法

1.3.1模糊控制原理

1.3.2自适应模糊控制技术

1.3.3在线自组织动态模糊Q强化学习算法的提出

1.4研究任务及论文构成

1.4.1本研究的背景

1.4.2本文的工作

1.4.2论文的构成

第二章动态模糊Q学习算法的实时动作输出及评估更新

2.1动态模糊Q学习算法的学习环境

2.1.1强化学习算法的学习过程

2.1.2动态模糊Q学习算法基础

2.2生成全局实时连续输出动作

2.3全局Q评估的更新

2.4有效跟踪策略

2.5自学习速率的自适应调整

2.6本章小结

第三章动态模糊Q学习算法模糊控制规则的自组织创建

3.1模糊控制器的完整性定义准则

3.2时序差分信号准则

3.3新规则的生成以及模糊集的确定

3.4模糊控制规则q评估的确定

3.5动态模糊Q学习算法的自学习流程

3.6本章小结

第四章移动机器人的设计及其实时自主控制的仿真分析

4.1双履带复合移动机器人的设计方案

4.1.1双履带复合移动越障机器人的结构设计

4.1.2双履带复合移动越障机构的控制方案

4.2在线自组织动态模糊Q学习算法的仿真分析

4.2.1在线自组织动态模糊Q学习算法的仿真环境

4.2.2基于专家经验的基础模糊控制器的设计

4.2.3动态模糊Q学习算法基于全局实时连续动作的输出以及评估更新优化的仿真分析

4.2.4动态模糊Q学习算法的仿真分析

4.2.5在线自组织动态模糊Q学习算法小结

4.3本章小结

第五章基于多传感融合的路径规划策略

5.1基于双目立体视觉的路径规划算法

5.1.1改进的机器人双目立体视觉图像匹配

5.1.2基于模式分类的双目立体视觉主动式路径规划算法

5.2基于传感信息的模糊控制实时路径规划及陷阱克服策略

5.2.1基于模糊控制的路径规划

5.2.2陷阱克服策略

5.2.3路径规划算法仿真分析

5.2.4本节小结

5.3基于多传感融合的准实时路径规划策略

5.4本章小结

第六章总结

6.1主要结论

6.2创新之处

参考文献

附录跳跃移动机器人系统

第一章绪论

第二章跳跃机构的基本结构设计和理论分析

2.1构造和驱动机理

2.2直线运动的实现

2.3圆弧曲线运动分析

2.4二维平面的自由移动

第三章共振式跳跃机构的结构设计和理论分析

3.1共振式跳跃移动机构的驱动机理分析

3.2共振式跳跃移动机构的运动学分析

3.3共振式跳跃移动机构的实验

3.4本章小结

第四章救助用共振式跳跃机器人平台

4.1设计思路

4.2小型共振式跳跃救助机器人设计

4.3实验

第五章共振式跳跃机器人的结论和展望

5.1主要结论和展望

5.2主要创新之处

参考文献

致谢

攻读学位期间发表的学术论文及获得的专利

展开▼

摘要

本文提出一种新型的在线自组织动态模糊Q强化学习算法,该算法利用扩展的贪心算法作为系统模糊控制规则的输出动作的选择,根据解模糊来求出系统全局连续的动作输出,根据规则选择的动作求出当前状态下全局动作的评估,并与规则中的理论最优全局最优动作输出的评估进行比较,当机器人在执行了该动作输出达到下一状态之后,获得了系统回报,计算出机器人此时的时序差分信号,同时为了加速系统的学习进度,保证在连续的状态下对输出的全局连续动作进行有效的自学习,采用累计有效跟踪策略来加速系统的学习进程,同时为了防止系统在学习过程中过于振荡或者收敛速度过慢,对系统过程中的学习速率参数采用后设学习规则进行参数的自适应调整。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号