无模型强化学习研究综述

秦智慧; 李宁; 刘晓彤; 刘秀磊; 佟强; 刘旭红

首页> 中文期刊> 《计算机科学》 >无模型强化学习研究综述

无模型强化学习研究综述

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

强化学习(Reinforcement Learning,RL)作为机器学习领域中与监督学习、无监督学习并列的第三种学习范式,通过与环境进行交互来学习,最终将累积收益最大化.常用的强化学习算法分为模型化强化学习(Model-based Reinforcement Lear-ning)和无模型强化学习(Model-free Reinforcement Learning).模型化强化学习需要根据真实环境的状态转移数据来预定义环境动态模型,随后在通过环境动态模型进行策略学习的过程中无须再与环境进行交互.在无模型强化学习中,智能体通过与环境进行实时交互来学习最优策略,该方法在实际任务中具有更好的通用性,因此应用范围更广.文中对无模型强化学习的最新研究进展与发展动态进行了综述.首先介绍了强化学习、模型化强化学习和无模型强化学习的基础理论;然后基于价值函数和策略函数归纳总结了无模型强化学习的经典算法及各自的优缺点;最后概述了无模型强化学习在游戏AI、化学材料设计、自然语言处理和机器人控制领域的最新研究现状,并对无模型强化学习的未来发展趋势进行了展望.

著录项

来源
《计算机科学》 |2021年第3期|180-187|共8页
作者
秦智慧; 李宁; 刘晓彤; 刘秀磊; 佟强; 刘旭红;
展开▼
作者单位

北京材料基因工程高精尖创新中心(北京信息科技大学) 北京 100101;

北京信息科技大学数据与科学情报分析实验室北京 100101;

北京材料基因工程高精尖创新中心(北京信息科技大学) 北京 100101;

北京材料基因工程高精尖创新中心(北京信息科技大学) 北京 100101;

中国科学院煤炭化学研究所煤转化国家重点实验室太原 030001;

中科合成油技术有限公司国家能源煤基液体燃料研发中心北京 101400;

中国科学院大学北京 100049;

北京材料基因工程高精尖创新中心(北京信息科技大学) 北京 100101;

北京信息科技大学数据与科学情报分析实验室北京 100101;

北京材料基因工程高精尖创新中心(北京信息科技大学) 北京 100101;

北京信息科技大学数据与科学情报分析实验室北京 100101;

北京材料基因工程高精尖创新中心(北京信息科技大学) 北京 100101;

北京信息科技大学数据与科学情报分析实验室北京 100101;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
人工智能; 强化学习; 深度强化学习; 无模型强化学习; 马尔可夫决策过程;

相似文献

中文文献
外文文献
专利

1. 基于模型的机器人强化学习研究综述 [J] . 孙世光 ,兰旭光 ,张翰博 . 模式识别与人工智能 . 2022,第1期
2. 模型化强化学习研究综述 [J] . 赵婷婷 ,孔乐 ,韩雅杰 . 计算机科学与探索 . 2020,第006期
3. 最新无模型深度强化学习研究:从零开始训练机器人"玩乐高" [J] . Tuomas Haarnoja ,Vitchyr Pong ,Aurick Zhou . 机器人产业 . 2018,第003期
4. 最新无模型深度强化学习研究：从零开始训练机器人“玩乐高” [J] . Tuomas Haarnoja ,Vitchyr Pong ,Aurick Zhou . 机器人产业 . 2018,第003期
5. 传感网中无标度拓扑模型研究综述 [J] . 王莹 . 计算机时代 . 2019,第005期
6. 全密封无泯漏磁力泵研究综述 [C] . 施卫东 . 中国动力工程学会第二届青年学术年会 . 1999
7. 基于改进强化学习的机械臂无标定视觉伺服控制 [A] . 王腾飞 . 2019

无模型强化学习研究综述

摘要

著录项

相似文献

相关主题

期刊订阅