首页> 外文会议>知能システムシンポジウム >相手モデルに基づくモンテカルロホ探索による対戦相手の力量推定
【24h】

相手モデルに基づくモンテカルロホ探索による対戦相手の力量推定

机译:基于其他模型的MONT Carloho搜索估计对手的电力量

获取原文

摘要

近年,ゲームAIはコンピュータの計算能力の向上や着手アルゴリズムの改善によってその強さは向上し続けており,プロに勝利するなど十分な領域に達している.これまでに研究·開発されてきた強いゲームAIは,ゲームに勝つために相手に依存せず盤面の最善手を選ぶということで実現されてきた.特に囲碁のゲームAIであるAlphaGOはモンテカルロホ探索のシミュレーションを用いた探索手法であるモンテカルロ探索を用いることでその強さは飛躍的に向上している.しかしながら,将棋やオセロゲームなどではモンテカルロ探索手法において,ランダム着手選択によるプレイアウトの勝率推定精度があまり良くないという問題点があり,解決するための手法として,モンテカルロホ探索において勝率を保持するノードを増やすことやプレイアウトにおける方策を改善するという方法などがある.これに対し本研究では,プレイアウトを行う際,盤面の単調増加評価関数を用いて,ランダム選択よりも良い評価の手を選ぶ改良モンテカルロホ探索に基づき勝率推定の精度改善を提案する.具体的には,オセロゲームでの確定石数を盤面評価に用いて精度向上の評価を行う.
机译:近年来,游戏AI改善了计算机计算能力并改善了起始算法,其实力继续提高,并已达到足够的面积,例如赢得专业人士。通过选择董事会最好的手而没有取决于赢得游戏的佳肴,已经实现了强大的游戏AI已经实现了。特别是,通过使用Monte Carlo搜索,alphano,Go的游戏AI大大提高了它的强度,这是一种使用蒙特卡罗卢搜索的仿真的搜索方法。然而,在Shogi和Othello游戏等中,存在随机起始选择的播出的获胜估计准确性并不是很好,并且作为解决蒙特卡洛队中获胜率的节点搜索有一种增加和提高播出措施的方法。另一方面,在本研究中,在执行播放时,电路板的单调增加的评估功能用于基于改进蒙特卡罗鲁搜索的获取估计的精度提高,该估计比随机选择优于良好的评估手。具体地,使用奥赛罗游戏中的固定石头数进行精度改善的评估,用于电路板表面评估。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号