基于异环境重要性采样的增强DDRQN网络

樊龙涛; 张森; 普杰信; 刘源源

首页> 中文期刊> 《火力与指挥控制》 >基于异环境重要性采样的增强DDRQN网络

基于异环境重要性采样的增强DDRQN网络

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

cqvip:针对局部可观测多智能体学习环境下,智能体与环境频繁交互造成环境不稳定,导致智能体无法使用经验回放机制(experience replay)的问题,采用了一种基于异环境重要性采样的回放经验利用机制。并结合该机制再深度强化学习算法,深度分布式循环Q网络(DDRQN)基础上进行了改进,提出一种增强型的深度分布式循环Q网络。通过对DeepMind的PySC2平台DefeatRoaches局部可观测多智能体学习环境实验结果对比分析表明,增强型的深度分布式循环Q网络相比于DDRQN网络,具有良好的学习性能,稳定性、收敛速度均具有显著提升。

著录项

来源
《火力与指挥控制》 |2020年第1期|47-52|共6页
作者
樊龙涛; 张森; 普杰信; 刘源源;
展开▼
作者单位

河南科技大学信息工程学院河南洛阳 471023;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工智能理论;
关键词
多智能体; 强化学习; 局部可观测; 经验回放机制; 重要性采样;

相似文献

中文文献
外文文献
专利

1. 基于异源图像引导的红外图像增强算法 [J] . 臧维明 ,邓文 ,李红 . 中国电子科学研究院学报 . 2017,第004期
2. 网络媒体共同抵制虚假新闻营造和谐网络环境增强社会责任 [J] . . 网络传播 . 2007,第012期
3. 探讨基于网络环境的教与学推动高中研究性学习的深入开展—“全国中小学基于网络环境的教与学暨高中研究性学习研讨会”侧记 [J] . 刘扬云 . 信息技术教育 . 2002,第001期
4. 探讨基于网络环境的教与学推动高中研究性学习的深入开展——“全国中小学基于网络环境的教与学暨高中研究性学习研讨会”侧记 [J] . 刘扬云 . 信息技术教育 . 2002,第011期
5. 如何增强网络议政远程协商实效——基于江苏省网络议政远程协商实践探究 [J] . 瞿超 ,刘影 ,沈雅琴 . 江苏省社会主义学院学报 . 2020,第005期
6. 异构网络环境中基于智能小车的按需网络增强系统 [C] . SHENG Jian ,生建 ,GUAN Mingfeng . 2017年全国物联网技术与应用大会暨2017年全国无线电应用与管理学术会议 . 2017
7. 复杂环境下基于生成对抗网络的视觉增强与感知方法研究 [A] . 张鉴 . 2020

基于异环境重要性采样的增强DDRQN网络

摘要

著录项

相似文献

相关主题

期刊订阅