强化学习维数灾问题解决方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本文针对强化学习任务中存在的一个普遍且重要的问题“维数灾”困难，即状态空间的大小随着特征数量的增加而发生指数级的增长，提出两种方法从不同的角度来解决“维数灾”困难和优化强化学习方法。同时，在所提理论的基础上，以Eclipse为开发平台，在SWT的基础上，开发了俄罗斯方块游戏，将其作为算法的实验平台，从而对相应的方法进行实验效果的验证。同时又将强化学习理论应用到Ad Hoc网络路由选择算法中，集中解决了路由效率、能源开销、安全性等相关问题。本文的主要研究成果概括为以下四个方面： (1)分析研究了强化学习中的“维数灾”问题，并在此基础上提出了一种大规模离散空间中的高斯强化学习方法。实验结果表明，结合了高斯过程的强化学习方法在各方面性能，如收敛速度以及最终实验效果等都有所提高。 (2)针对强化学习的“维数灾”问题和算法收敛速度过慢的困难，提出了一种基于动作分值的分层强化学习奖赏优化方法。使用了动作分值和分层思想的强化学习方法可以达到优化奖赏函数和加快收敛速度的效果。实验结果表明，使用了该方法的强化学习算法能显著提高算法的收敛速度和实验效果。 (3)以俄罗斯方块游戏为实验平台，将上述方法应用于其中，分析各个算法的优劣和各类参数的性能比较，并提出可以进一步改进的实验效果的若干思想。 (4)以Ad Hoc网络为应用平台，将相关的强化学习方法应用于Ad Hoc网络路由选择过程中，从综合的角度来解决Ad Hoc网络中存在的路由效率、能源开销、安全性、自适应性等路由选择问题。

著录项

作者
周文云;
展开▼
作者单位

苏州大学;

展开▼
授予单位苏州大学;
学科计算机应用技术
授予学位硕士
导师姓名刘全;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;
关键词
强化学习; 维数灾; Ad Hoc网络; 高斯过程;

相似文献

中文文献
外文文献
专利

1. 大规模水电系统优化调度维数灾问题研究进展 [J] . 冯仲恺 ,牛文静 ,程春田 . 水电与抽水蓄能 . 2021,第005期
2. 一种消除动态规划法中维数灾的新方法 [J] . 向凌 ,周建中 ,杨敬涛 . 电力系统及其自动化学报 . 2004,第003期
3. 基于改进EMD与关联维数的谐振接地故障选线方法研究 [J] . 范津玮 ,刘晓波 ,袁旭峰 . 电力科学与工程 . 2021,第006期
4. 基于小波包和分形维数的瓦斯传感器状态评估方法研究 [J] . 冯源琪 ,左弯弯 ,王金川 . 电气防爆 . 2021,第003期
5. 图像块流形维数及其证明方法研究 [J] . 何瑞强 . 吉林师范大学学报（自然科学版） . 2021,第002期
6. 球形火焰分形维数的计算方法研究 [C] . 李格升 ,梁俊杰 ,张尊华 . 中国工程热物理学会2014年年会 . 2014
7. 解决强化学习中维数灾问题的方法研究 [A] . 闫其粹 . 2010

强化学习维数灾问题解决方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅