首页> 中文学位 >双人博弈问题中的蒙特卡洛树搜索算法的改进
【6h】

双人博弈问题中的蒙特卡洛树搜索算法的改进

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景

1.2 研究现状

1.3 研究意义

1.4 论文内容

1.5 论文结构

第二章 双人博弈中的基本理论与方法

2.1 双人博弈的主要特征

2.2 机器学习

2.3 博弈树

2.4 博弈树的基本探索方法

2.4.1 极大极小值算法

2.4.2 Alpha-Beta剪枝算法

2.5 双人博弈问题中的最优解问题

2.6 本章小结

第三章 蒙特卡洛树搜索

3.1 蒙特卡洛模拟评估

3.2 多臂匪徒问题与上限信心界策略

3.3 蒙特卡洛树搜索

第四章 蒙特卡洛树搜索的分析与改进

4.1 蒙特卡洛树搜索算法的缺点

4.1.1 收敛速度慢

4.1.2 模拟结果不收敛到最优解

4.2 蒙特卡洛树搜索算法的改进

4.2.1 对于选择策略的剪枝方法

4.2.2 对于蒙特卡洛模拟过程的改进

4.3 本章小结

第五章 实验及分析

5.1 模拟评估的改进实验

5.1.1 对原始模拟评估法进行测评

5.1.2 对改进后的模拟评估法进行测评

5.1.3 于更大的博弈进行评估

5.2 剪枝策略的改进实验

5.3 实验分析

第六章 总结

6.1 论文总结

6.2 未来的工作与发展

参考文献

致谢

在读期间发表的学术论文与取得的其他研究成果

展开▼

摘要

人工智能是现在非常重要的研究领域,不仅仅在计算机领域,各行各业都有着广泛的运用。机器学习是人工智能的重要分支,随着机器学习方法的不断发展,人们对于人工智能的理解也有了更深层次的理解,从指导计算机学习逻辑推理,到教会计算机一些先验知识做成专家系统,到现在让计算机学会自我学习。不仅仅在于处理大数据上,人工智能有着广泛的运用,在指导人类制定策略上也有着更加重要的指导作用。
  双人博弈游戏中的AI算法就是人工智能的重要的发展方向与运用前景。AlphaGo的出现标志着双人博弈问题上的最大的难题围棋也被攻破,AlphaGo巧妙的将深度学习和蒙特卡洛树搜索算法,卷积神经网络等方法结合在一起,大大提升了围棋AI的计算效率,使得在人类规则下,计算机击败最优秀的职业棋手成为现实。AlphaGo的成功并不意味着现在的算法就是最优的,在研究过程中发现蒙特卡洛树搜索算法中还存在着不少的问题与隐患。
  蒙特卡洛树搜索(MCTS)是一种针对决策类博弈游戏,运用蒙特卡洛模拟方法进行评估博弈策略的启发式搜索算法。但是,在面对计算机围棋这样复杂的决策过程时,简单的蒙特卡洛树搜索过程往往由于计算量大,导致收敛慢。本文中我们指出,双人博弈游戏中的蒙特卡洛树搜索不能收敛于双人博弈的最佳决策策略;由此我们提出蒙特卡洛树搜索结合极大极小值算法的改进算法,使得搜索结果不会因为蒙特卡洛方法的随机性导致失真。为了进一步提高复杂双人博弈游戏中搜索算法的计算效率,我们还结合了几种常见的剪枝策略。实验测试说明,该新算法显著改进了蒙特卡洛树搜索的准确性和效率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号