声明
摘要
第一章 绪论
1.1 研究背景
1.2 研究现状
1.3 研究意义
1.4 论文内容
1.5 论文结构
第二章 双人博弈中的基本理论与方法
2.1 双人博弈的主要特征
2.2 机器学习
2.3 博弈树
2.4 博弈树的基本探索方法
2.4.1 极大极小值算法
2.4.2 Alpha-Beta剪枝算法
2.5 双人博弈问题中的最优解问题
2.6 本章小结
第三章 蒙特卡洛树搜索
3.1 蒙特卡洛模拟评估
3.2 多臂匪徒问题与上限信心界策略
3.3 蒙特卡洛树搜索
第四章 蒙特卡洛树搜索的分析与改进
4.1 蒙特卡洛树搜索算法的缺点
4.1.1 收敛速度慢
4.1.2 模拟结果不收敛到最优解
4.2 蒙特卡洛树搜索算法的改进
4.2.1 对于选择策略的剪枝方法
4.2.2 对于蒙特卡洛模拟过程的改进
4.3 本章小结
第五章 实验及分析
5.1 模拟评估的改进实验
5.1.1 对原始模拟评估法进行测评
5.1.2 对改进后的模拟评估法进行测评
5.1.3 于更大的博弈进行评估
5.2 剪枝策略的改进实验
5.3 实验分析
第六章 总结
6.1 论文总结
6.2 未来的工作与发展
参考文献
致谢
在读期间发表的学术论文与取得的其他研究成果