声明
摘要
第1章 绪论
1.1 引言
1.2 POMDP研究现状与主要算法
1.2.1 精确算法
1.2.2 近似算法
1.3 本文工作
1.4 文章结构
第2章 POMDP介绍
2.1 MDP模型
2.1.1 模型定义
2.1.2 性能准则
2.1.3 策略
2.1.4 求解
2.2 POMDP模型
2.2.3 策略
2.2.4 信念状态
2.2.5 求解
2.3 本章小结
第3章 基于迭代函数和基于点的近似算法
3.1 基于迭代函数的近似算法
3.1.1 最优值函数的上下界
3.1.2 基于MDP的近似
3.1.3 快速告知边界法
3.1.4 基于完全不可观测MDP的近似
3.1.5 Blind policy
3.2 基于点的近似算法
3.2.1 基于点算法的主要思想
3.2.2 基于点的值迭代
3.2.3 Perseus算法
3.2.4 启发式搜索值迭代
3.2.5 前向搜索值迭代
3.2.6 最优策略下可达空间的连续近似
3.3 本章小结
第4章 下界近似算法-相关状态更新
4.1 引言
4.2 可达信念状态空间
4.3 相关状态更新法
4.4 状态采样
4.5 近似值迭代
4.6 利用拓扑结构加速迭代
4.7 本章小结
5.1 引言
5.2 值函数上下界
5.3 启发式搜索值迭代
5.4 信念状态空间选择
5.5 多路启发式搜索值迭代
5.5.1 信念点选择
5.5.2 信念点的剪枝
5.5.3 算法描述
5.5.4 算法收敛陛
5.6 本章小结
第6章 实验与分析
6.1 问题模型
6.1.1 Hallway
6.1.2 Hallway2
6.1.3 RockSample(4,4)
6.1.4 Tag
6.1.5 Underwater Navigation
6.2 实验结果
6.3 实验分析
6.4 本章小结
第7章 总结与展望
7.1 本文工作总结
7.2 展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果