文摘
英文文摘
声明
第一章引言
1.1问题的提出
1.2国内外研究现状
1.2.1国内研究现状
1.2.2国外研究现状
1.3论文主要研究内容
1.4文章内容安排
第二章理论基础
2.1强化学习简介
2.2强化学习发展历史
2.3强化学习理论基础
2.4强化学习主要算法
2.4.1瞬时差分方法
2.4.2行动者-批评家算法
2.4.3 R-learning算法
2.5本章小结
第三章一种大规模离散空间中的高斯强化学习方法
3.1高斯过程
3.1.1高斯过程简介
3.1.2高斯过程原理
3.2高斯过程强化学习方法
3.2.1使用高斯过程的回归方法
3.2.2基于高斯过程的状态值函数回归算法
3.3实验结果和分析
3.4本章小结
第四章一种基于动作分值的分层强化学习奖赏优化方法
4.1分层强化学习
4.2无限循环任务的分层方法
4.3动作分值
4.4无限循环任务中基于动作分值的奖赏优化
4.5奖赏优化算法
4.6引入分治机制的动作分值
4.7实验以及结果分析
4.8本章小结
第五章强化学习在Ad Hoc无线网络路由算法中的应用
5.1 Ad Hoc网络
5.1.1 Ad Hoc网络概述
5.1.2 Ad Hoc网络特征
5.1.3 Ad Hoc网络结构
5.1.4 Ad Hoc网络路由算法
5.2强化学习在Ad Hoc路由算法中的应用
5.2.1 AODV路由协议详细介绍
5.2.2 Ad Hoc无线网络中的强化学习模型
5.2.3 RS-AODV路由协议
5.2.4 Ad Hoc网络中的RS-AODV路由算法
5.3实验以及结果分析
5.3.1仿真环境
5.3.2仿真结果
5.4本章小结
第六章总结与展望
6.1本文工作总结
6.2以后的工作展望
参考文献
攻读硕士期间发表(录用)的论文和参加的科研项目
致谢
苏州大学;