声明
致谢
1绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 本文主要工作
1.4 论文组织结构
1.5 本章小结
2强化学习基础理论
2.1 马尔可夫决策过程
2.1.1 策略
2.1.2 奖励函数
2.1.3 值函数
2.2 时序差分学习
2.2.1 Sarsa: 同步策略控制
2.2.2 Q-Learning:异步策略控制
2.3 本章小结
3基于强化学习的MEC资源联合分配算法
3.1 MEC 资源分配算法优化目标
3.1.1 MEC受益率最大化
3.1.2 移动终端用户设备平均开销最小化
3.2 无功率控制下的资源联合分配算法
3.2.1 无功率控制下的本地计算模型
3.2.2 无功率控制下的任务卸载模型
3.3 基于功率控制的资源联合分配算法
3.3.1 基于功率控制的本地计算模型
3.3.2 基于功率控制的任务卸载模型
3.4 本章小结
4 资源联合分配算法仿真实验与分析
4.1 无功率控制下的资源联合分配算法仿真实验与分析
4.2 基于功率控制的资源联合分配算法仿真实验与分析
4.3 本章小结
5总结与展望
5.1 总结
5.2 展望
参考文献
作者简历
学位论文原创性声明
学位论文数据集