文摘
英文文摘
论文说明:图例目录
声明
第一章绪论
§1.1研究背景
§1.1.1基于行为的机器人研究
§1.1.2自主机器人的包容式结构
§1.2强化学习的研究现状
§1.2.1强化学习的主要算法
§1.2.2强化学习的应用现状
§1.3基于强化学习的机器人系统的行为学习研究
§1.3.1单机器人系统的行为学习研究
§1.3.2多机器人系统的行为学习研究
§1.4觅食任务的研究现状
§1.5本论文的研究内容及组织
第二章基于行为的移动机器人仿真实验平台
§2.1引言
§2.2仿真实验平台
§2.2.1平台的组成
§2.2.2平台的控制系统
§2.3噪声叠加方式和噪声模型的确定
§2.3.1仿真控制算法
§2.3.2仿真环境
§2.3.3仿真结果和讨论
§2.4小结
第三章基于过程奖赏和优先扫除的强化学习算法
§3.1引言
§3.2强化学习算法
§3.2.1强化学习的理论与算法
§3.2.2 Q学习算法
§3.2.3优先扫除算法
§3.3过程奖赏函数
§3.4仿真实验验证
§3.4.1觅食任务描述
§3.4.2仿真控制算法
§3.4.3仿真环境
§3.4.4仿真结果和讨论
§3.5小结
第四章移动机器人的噪声影响及其消解策略
§4.1引言
§4.2噪声的模型及仿真处理
§4.3噪声鲁棒性的评价方法
§4.4仿真实验验证
§4.4.1仿真控制算法
§4.4.2仿真环境
§4.4.3仿真结果和讨论
§4.5小结
第五章基于强化学习的多机器人系统冲突消解策略
§5.1引言
§5.2基于手工编程的消解策略
§5.2.1同构策略
§5.2.2地域型异构策略
§5.3基于强化学习的消解策略
§5.3.1多机器人系统的强化学习
§5.3.2多机器人系统的奖赏函数
§5.3.3多机器人系统群体觅食任务的强化学习算法
§5.4仿真实验验证
§5.4.1仿真环境
§5.4.2仿真结果和讨论
§5.5小结
第六章结论及展望
§6.1论文工作总结
§6.2进一步工作展望
参考文献
附录 仿真控制算法
A导航任务仿真控制算法
B觅食任务仿真控制算法
攻读博士学位期间完成的论文
致谢