首页> 外文期刊>Nature >A distributional code for value in dopamine- based reinforcement learning
【24h】

A distributional code for value in dopamine- based reinforcement learning

机译:基于多巴胺的强化学习中的价值分配代码

获取原文
获取原文并翻译 | 示例
           

摘要

Since its introduction, the reward prediction error theory of dopamine has explained a wealth of empirical phenomena, providing a unifying framework for understanding the representation of reward and value in the brain(1-3). According to the now canonical theory, reward predictions are represented as a single scalar quantity, which supports learning about the expectation, or mean, of stochastic outcomes. Here we propose an account of dopamine-based reinforcement learning inspired by recent artificial intelligence research on distributional reinforcement learning(4-6). We hypothesized that the brain represents possible future rewards not as a single mean, but instead as a probability distribution, effectively representing multiple future outcomes simultaneously and in parallel. This idea implies a set of empirical predictions, which we tested using single-unit recordings from mouse ventral tegmental area. Our findings provide strong evidence for a neural realization of distributional reinforcement learning.
机译:自引入以来,多巴胺的奖励预测误差理论已经解释了许多经验现象,为理解大脑中奖励和价值的表示提供了统一的框架(1-3)。根据现在的规范理论,报酬预测表示为单个标量,它支持了解随机结果的期望值或均值。在这里,我们提出了一种基于多巴胺的强化学习的方法,该方法受最近关于分布式强化学习的人工智能研究的启发(4-6)。我们假设大脑不是以均值的方式代表未来可能的回报,而是以概率分布的方式来代表,可以有效地同时并行地代表多个未来成果。这个想法暗示了一组经验预测,我们使用来自小鼠腹侧被盖区的单个单位记录进行了测试。我们的发现为神经网络实现分布强化学习提供了有力的证据。

著录项

  • 来源
    《Nature》 |2020年第7792期|671-675|共5页
  • 作者单位

    DeepMind London England;

    DeepMind London England|UCL Max Planck UCL Ctr Computat Psychiat & Ageing Res London England;

    Harvard Univ Dept Mol & Cellular Biol Ctr Brain Sci Cambridge MA 02138 USA;

    DeepMind London England|UCL Gatsby Computat Neurosci Unit London England;

  • 收录信息 美国《科学引文索引》(SCI);美国《工程索引》(EI);美国《生物学医学文摘》(MEDLINE);美国《化学文摘》(CA);
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号