首页> 中文学位 >面向在线决策的强化学习算法硬件实现及应用

【6h】

面向在线决策的强化学习算法硬件实现及应用

代理获取

页面导航

目录
著录项
相似文献
相关主题

目录

第1 章绪论

1.1 课题背景及研究意义

1.2 国内外研究现状分析

1.2.1 在线决策技术相关研究现状

1.2.2 强化学习相关研究现状

1.2.3 强化学习硬件加速的相关研究现状

1.2.4 研究现状分析总结

1.3 主要研究内容

第2 章总体研究方案

2.1 系统设计要求与分析

2.2 DQN 算法理论基础及分析

2.2.1 Q 学习算法

2.2.2 神经网络算法

2.2.3 DQN 算法分析

2.3 技术路线

2.4 本章小结

第3 章 DQN 算法的硬件加速器设计及优化

3.1 引言

3.2 DQN 算法加速的设计任务分解

3.3 DQN 算法加速器设计

3.3.1 DQN 算法 IP 核结构设计

3.3.2 加速算子单元 VMPU 设计

3.3.3 计算模块与控制模块设计

3.3.4 设计空间探索及优化

3.3.5 仿真验证

3.4 DQN 算法加速过程的任务调度

3.5 本章小结

第4 章应用验证与性能分析

4.1 引言

4.2 应用验证环境搭建

4.2.1 验证平台组成及工作原理描述

4.2.2 软件环境构建

4.3 倒立摆控制决策应用验证

4.3.1 倒立摆控制决策应用分析

4.3.2 面向倒立摆控制决策的环境构建

4.3.3 面向倒立摆控制决策应用的加速器参数探索寻优

4.3.4 验证与性能分析

4.4 无人机自主决策应用验证

4.4.1 无人机自主决策应用分析

4.4.2 无人机自主决策环境建模

4.4.3 面向无人机自主决策应用的加速器参数探索寻优

4.4.4 验证与性能分析

4.5 本章小结

结论

参考文献

攻读硕士学位期间发表的论文及其它成果

声明

致谢

展开▼

著录项

作者
李喜鹏;
展开▼
作者单位

哈尔滨工业大学;

展开▼
授予单位哈尔滨工业大学;
学科仪器仪表工程
授予学位硕士
导师姓名凤雷;
年度 2020
页码
总页数
原文格式 PDF
正文语种 chi
中图分类 TP2X92;
关键词

相似文献

中文文献
外文文献
专利

1. 深度强化学习算法在智能军事决策中的应用 [J] . 况立群 ,李思远 ,冯利 . 计算机工程与应用 . 2021,第020期
2. 强化学习算法在超视距空战辅助决策上的应用研究 [J] . 吴宜珈 ,赖俊 ,陈希亮 . 航空兵器 . 2021,第002期
3. 强化学习算法在分阶段组合投资决策中的应用 [J] . 党兴华 ,权小锋 ,尹洪英 . 科技管理研究 . 2006,第003期
4. 面向大规模数据决策的在线随机任务分配算法 [J] . 黄素叶 . 中原工学院学报 . 2020,第006期
5. RAIN:一种面向软硬件和门限实现的轻量分组密码算法 [J] . 曹梅春 ,张文英 ,陈彦琴 . 计算机研究与发展 . 2021,第005期
6. 面向硬件实现的SPIHT编码算法研究 [C] . 毛耿 ,常青 . 第四届全国信号和智能信息处理与应用学术会议 . 2010
7. 面向Xilinx Virtex-7的DMA数据传输软硬件系统设计实现及在BFS算法中的应用 [A] . 张宇飞 . 2015

代理获取

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号