AlphaGo与AlphaZero原理和未来应用研究

陈铭禹

首页> 中文期刊> 《通讯世界》 >AlphaGo与AlphaZero原理和未来应用研究

AlphaGo与AlphaZero原理和未来应用研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

cqvip:人工智能长期以来的目标就是创造机器的完全主导领域,在人类生活中发挥作用。AlphaGo成为首个在围棋中战胜人类世界冠军的系统。AlphaGo神经网络使用人类的棋盘数据进行学习训练,同时也通过自我对弈进行强化学习。围棋对于人工智能来说是最具有挑战性的经典博弈比赛,它的巨大的搜索空间,棋局和落子地点让机器学习难以应对。科学家创造了一种新的人工智能程序系统AlphaGo,使用估值网络来评估局势以及使用策略网络来选择如何落子。这些深度神经网络被一种新的组合来训练:使用了人类专业比赛数据的监督学习,以及自我对弈的强化学习。AlphaZero没有使用任何预测搜索的方法,神经网络搭配最先进的蒙特卡洛树搜索算法让程序达到了更加精确和智能的水准,这程序模拟了数以千计的自我对弈的随机博弈。Alpha系列达到了99.8%的胜率,这是史上第一次计算机程序在全尺寸围棋中击败人类职业棋手。通过对AlphaGo和AlphaZero原理学习,我们可以在掌握现有先进技术的基础上,开拓创新,思考类似的人工智能在医学,军事等领域的未来应用可能性。

著录项

来源
《通讯世界》 |2019年第12期|22-23|共2页
作者
陈铭禹;
展开▼
作者单位

杭州师范大学附属中学浙江杭州310030;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工智能理论;
关键词
AlphaGo; AlphaZero; 策略网络与决策网络; 蒙特卡洛树搜索;

相似文献

中文文献
外文文献
专利

1. AlphaZero原理与启示 [J] . 唐川 ,陶业荣 ,麻曰亮 . 航空兵器 . 2020,第003期
2. AlphaGo技术原理分析及人工智能军事应用展望 [J] . 陶九阳 ,吴琳 ,胡晓峰 . 指挥与控制学报 . 2016,第002期
3. AlphaGo技术原理分析及人工智能军事应用展望 [J] . 陶九阳12 ,吴琳1 ,胡晓峰1 . 指挥与控制学报 . 2016,第002期
4. 未来人工智能:从AlphaGo到BetaGO [J] . 杨小康 . 科学（上海） . 2017,第003期
5. 从AlphaGo的胜利看人工智能的未来 [J] . 阮晓东 . 新经济导刊 . 2016,第006期
6. "改造世界的人们,当然也改造着自己"——在AlphaGo身边眺望人类未来 [C] . 李广益 . 重庆市2016年度科普工作理论研讨会 . 2016
7. AlphaGo的运行机制及其能动性研究 [A] . 孙锐 . 2019

AlphaGo与AlphaZero原理和未来应用研究

摘要

著录项

相似文献

相关主题

期刊订阅