首页> 中文期刊> 《沈阳理工大学学报》 >TD-BP强化学习算法在五子棋博弈系统中的应用

TD-BP强化学习算法在五子棋博弈系统中的应用

         

摘要

局面估值的准确性是决定棋类游戏水平高低的一个重要因素.针对使用静态估值函数的不足,提出了TD-BP强化学习算法,结合博弈中常用的极小极大搜索算法和经过历史启发增强的PVS搜索算法,实现了一种自适应性较强的五子棋自学习程序.实验结果表明,使用该算法的程序经过较短时间的训练后达到了较好的下棋水平.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号