声明
摘要
第1章 绪论
1.1 研究背景和意义
1.2 多Agent决策的主要问题
1.2.1 决策问题的不确定性
1.2.2 多Agent决策技术
1.2.3 多Agent通信
1.2.4 对手建模
1.3 国内外研究现状
1.3.1 多Agent通信决策方法
1.3.2 多Agent对手建模方法
1.3.3 IDs的研究现状
1.4 本文的主要研究内容和结构
第2章 I-DIDs的基础知识
2.1 I-POMDPs模型
2.2 图模型
2.2.1 IDs模型
2.2.2 DIDs模型
2.2.3 I-IDs模型
2.2.4 I-DIDs模型
2.3 I-DIDs的求解算法
2.3.1 精确算法
2.3.2 近似算法
2.4 本章小结
第3章 I-DIDs的近似算法
3.1 引言
3.2 基于相对熵的DMU改进算法
3.2.1 DMU算法及相对熵
3.2.2 算法的描述
3.2.3 算法的复杂性与误差分析
3.3 基于N步前瞻的近似行为等价算法
3.3.1 N步前瞻的思想
3.3.2 近似行为等价算法
3.3.3 算法复杂性与误差分析
3.4 实验结果与分析
3.4.1 基于相对熵的DMU改进算法实验
3.4.2 基于N步前瞻的算法实验结果
3.5 本章小结
第4章 COM-IDIDs模型与算法研究
4.1 引言
4.2 COM-IDIDs的建模方法
4.3 COM-IDIDs建模与求解
4.3.1 COM-IDIDs的建模
4.3.2 COM-IDIDs的信度更新和值函数
4.3.3 基于EVD的COM-IDIDs的求解方法
4.3.4 COM-IDIDs的DMU算法
4.4 问题描述与试验结果
4.4.1 多Agent老虎问题
4.4.2 实验结果
4.5 本章小结
第5章 基于I-DIDs的对手建模
5.1 引言
5.2 识别对手模型
5.2.1 问题描述
5.2.2 应用贝叶斯学习识别模型
5.3 基于互信息的模型识别方法
5.3.1 互信息的相关概念
5.3.2 模型相关性和互信息
5.3.3 互信息识别模型的算法描述
5.4 实验结果与分析
5.4.1 公共物品博弈问题
5.4.2 敌对多Agent老虎问题
5.5 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
攻读博士期间发表的论文和参与项目
致谢
厦门大学;