プレイアウトと深層学習を組み合わせた囲碁アルゴリズム

机译：GO算法结合播出和深度学习

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

アルファ碁は従来のモンテカルロ木探索(Monte-Carlo Tree Search: MCTS)に基づく囲碁アルゴリズムにパラダイムシフトを起こした。アルファ碁は，教師付学習のSL Policy Network，強化学習のRL Policy Network，盤面評価関数のValue Network，という3つの深層学習を駆使する。従来のプレイアウトに代わるRollout PolicyやAPV-MCTS(Asynchronous Policy and Value-MCTS)のノード展開で威力を発揮するTree Policyも提案している。アルファ碁再現プロジェクトのひとつにRocAlphaGoがある。

机译：alphaflas基于Monte-Carlo树搜索导致PARADIGM移位到GO算法：MCTS。 Alpha Farse采用三个深度学习，如SL策略网络，加强学习RL策略网络，以及电路板表面评估功能的价值网络。我们还提出了树策策略，该政策在节点开发的Roplout策略和APV-MCT（异步策略和值-MCT）中施加电力而不是传统播放。其中一个alpha种族再生项目是rocalphago。

著录项

来源
《電気学会全国大会》|2019年|1(CD-ROM)|共2页
会议地点
作者
伊滕雅; 伊藤有人;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类 TM3-53;
关键词

相似文献

外文文献
中文文献
专利

1. 最適化問題における免疫アルゴリズムとウイルス進化論を組み合わせたアルゴリズムの提案 [J] . 井上拓也, 上手洋子, 西尾芳文電子情報通信学会技術研究報告. 非線形問題. Nonlinear Problems . 2014,第250期

机译：在优化问题中结合免疫算法和病毒进化理论的算法的建议
2. 最適化問題における免疫アルゴリズムとウイルス進化論を組み合わせたアルゴリズムの提案 [J] . 井上拓也, 上手洋子, 西尾芳文電子情報通信学会技術研究報告. 回路とシステム. Circuits and Systems . 2014,第249期

机译：在优化问题中结合免疫算法和病毒进化理论的算法的建议
3. 最適化問題における免疫アルゴリズムとウイルス進化論を組み合わせたアルゴリズムの提案 [J] . 井上拓也, 上手洋子, 西尾芳文電子情報通信学会技術研究報告. 非線形問題. Nonlinear Problems . 2014,第250期

机译：免疫算法与病毒进化理论在优化问题中结合算法的提议
4. プレイアウトと深層学習を組み合わせた囲碁アルゴリズム [C] . 伊滕雅, 伊藤有人電気学会全国大会 . 2019

机译：GO算法结合播出和深度学习
5. 組み換えを考慮したゲノムグラフにおけるアラインメントアルゴリズム [D] . 神保元脩 2019

机译：考虑重组的基因组图比对算法
6. 応答曲面法と遺伝的アルゴリズムを組み合わせた積層複合材料の設計手法 [O] . 竹田憲生, タケダノリオ 2017

机译：响应面法与遗传算法相结合的层状复合材料设计方法

プレイアウトと深層学習を組み合わせた囲碁アルゴリズム

摘要

著录项

相似文献

相关主题

期刊订阅