首页> 中文期刊> 《沈阳理工大学学报》 >TD-BP强化学习算法在五子棋博弈系统中的应用

TD-BP强化学习算法在五子棋博弈系统中的应用

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

局面估值的准确性是决定棋类游戏水平高低的一个重要因素.针对使用静态估值函数的不足,提出了TD-BP强化学习算法,结合博弈中常用的极小极大搜索算法和经过历史启发增强的PVS搜索算法,实现了一种自适应性较强的五子棋自学习程序.实验结果表明,使用该算法的程序经过较短时间的训练后达到了较好的下棋水平.

著录项

来源
《沈阳理工大学学报》 |2010年第4期|30-32,37|共4页
作者
宫瑞敏; 吕艳辉;
展开▼
作者单位

沈阳理工大学,信息科学与工程学院,辽宁,沈阳,110159;

沈阳理工大学,信息科学与工程学院,辽宁,沈阳,110159;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;人工神经网络与计算;
关键词
TD算法; BP神经网络; 估值函数; PVS算法;

相似文献

中文文献
外文文献
专利

1. 博弈树启发搜索算法在五子棋游戏中的应用研究 [J] . 王建雄 . 科技情报开发与经济 . 2011,第029期
2. 考虑市场因素的电力系统供需互动混合博弈强化学习算法 [J] . 包涛 ,李昊飞 ,余涛 . 控制理论与应用 . 2020,第004期
3. 强化学习算法在空调系统运行优化中的应用研究 [J] . 丁志梁 ,潘毅群 ,谢建彤 . 建筑节能 . 2020,第007期
4. 基于粒子群优化的多智能体强化学习算法在水下机器人定位系统中的应用 [J] . 高延增 ,叶家玮 ,龚幼 . 机床与液压 . 2010,第019期
5. 深度强化学习股票算法交易系统应用 [J] . 容梓豪 . 电脑知识与技术 . 2020,第023期
6. 基于博弈树的五子棋算法研究 [C] . 罗景 ,武汉大学计算机软件工程国家重点实验室 ,叶俊民 . 2004年全国理论计算机科学学术年会 . 2004
7. 基于搜索算法的人工智能在五子棋博弈中的应用研究 [A] . 王志水 . 2006

获取原文

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号