声明
厦门大学学位论文著作权使用声明
摘要
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 不确定决策
1.2.2 MDPs
1.2.3 基于单Agent的影响
1.2.4 基于多Agent的影响图
1.3 本文的主要内容和结构
第二章 交互式动态影响图基础知识
2.1 引言
2.2 影响图
2.3 动态影响图
2.3.1 POMDPs模型
2.3.2 DIDs模型
2.4 交互式动态影响图
2.4.1 I-POMDPs基本模型
2.4.2 I-DIDs模型
2.4.3 I-POMDPs和I-DIDs之间的联系
2.4.4 行为等价原理与DMU方法
2.5 本章小节
第三章 基于部分策略的行为等价原理
3.1 引言
3.2 行为等价原理和I-DIDs求解方法
3.3 近似行为等价原理
3.3.1 修正的BE原理
3.3.2 部分策略树的长度求解
3.4 算法复杂度和误差区间
3.5 实验例子
3.5.1 多Agent老虎问题
3.5.2 多Agent演唱会问题
3.5.3 多Agent UAV问题
3.6 实验结果
3.7 本章小节
第四章 增量式行为等价原理
4.1 引言
4.2 行为等价原理及其定义
4.3 增量式行为等价原理定义
4.3.1 近似的BE原理
4.3.2 增量式对比方法
4.3.3 算法
4.4 算法复杂度和误差区间
4.5 实验结果
4.6 本章小节
第五章 多Agent交互式动态影响图建模与求解
5.1 引言
5.2 相关方法介绍
5.2.1 DMU方法
5.2.2 贝叶斯网参数学习
5.3 I-MADIDs建模
5.4 I-MADIDs求解算法
5.4.1 DMU方法
5.4.2 贝叶斯网参数学习方法
5.5 算法复杂度和误差区间
5.5.1 DMU方法
5.5.2 贝叶斯网参数学习方法
5.6 实验结果
5.7 本章小节
第六章 总结与展望
6.1 总结
6.2 展望
6.2.1 继续研究I-MADIDs的建模及求解技术
6.2.2 研究通信行为在I-DIDs和I-MADIDs中的应用
6.2.3 研究I-DIDs的应用
附录
参考文献
在学期间发表及完成的论文
在学期间参与的课题项目
致谢