首页> 外国专利> DEEP REINFORCEMENT LEARNING WITH FAST UPDATING RECURRENT NEURAL NETWORKS AND SLOW UPDATING RECURRENT NEURAL NETWORKS

DEEP REINFORCEMENT LEARNING WITH FAST UPDATING RECURRENT NEURAL NETWORKS AND SLOW UPDATING RECURRENT NEURAL NETWORKS

机译:通过快速更新递归神经网络和缓慢更新递归神经网络进行深度强化学习

摘要

Methods, systems, and apparatus, including computer programs encoded on computer storage media, for reinforcement learning. One of the methods includes selecting an action to be performed by the agent using both a slow updating recurrent neural network and a fast updating recurrent neural network that receives a fast updating input that includes the hidden state of the slow updating recurrent neural network.
机译:用于加强学习的方法,系统和装置,包括编码在计算机存储介质上的计算机程序。方法之一包括使用缓慢更新的递归神经网络和快速更新的递归神经网络两者来选择由代理执行的动作,该快速更新的递归神经网络接收包括缓慢更新的递归神经网络的隐藏状态的快速更新的输入。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号