首页> 中文学位 >移动边缘计算中基于强化学习的计算和通信资源联合分配算法研究
【6h】

移动边缘计算中基于强化学习的计算和通信资源联合分配算法研究

代理获取

目录

声明

致谢

1绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 本文主要工作

1.4 论文组织结构

1.5 本章小结

2强化学习基础理论

2.1 马尔可夫决策过程

2.1.1 策略

2.1.2 奖励函数

2.1.3 值函数

2.2 时序差分学习

2.2.1 Sarsa: 同步策略控制

2.2.2 Q-Learning:异步策略控制

2.3 本章小结

3基于强化学习的MEC资源联合分配算法

3.1 MEC 资源分配算法优化目标

3.1.1 MEC受益率最大化

3.1.2 移动终端用户设备平均开销最小化

3.2 无功率控制下的资源联合分配算法

3.2.1 无功率控制下的本地计算模型

3.2.2 无功率控制下的任务卸载模型

3.3 基于功率控制的资源联合分配算法

3.3.1 基于功率控制的本地计算模型

3.3.2 基于功率控制的任务卸载模型

3.4 本章小结

4 资源联合分配算法仿真实验与分析

4.1 无功率控制下的资源联合分配算法仿真实验与分析

4.2 基于功率控制的资源联合分配算法仿真实验与分析

4.3 本章小结

5总结与展望

5.1 总结

5.2 展望

参考文献

作者简历

学位论文原创性声明

学位论文数据集

展开▼

摘要

万物互联时代已经到来,终端设备数量的飞速增长使得通信网络和互联网不断承受着巨大的压力。传统云计算的局限性表现得越来越明显,5G时代的来临也带来了移动边缘计算(Mobile Edge Computation,MEC)等新兴技术的蓬勃发展。移动边缘计算具有邻近性、低延迟、高带宽和位置感知等特点,能够大大缓解网络设备数量剧增、移动流量爆炸以及网络数据重传比例过高等网络拥堵问题。尽管如此,部署在移动边缘计算系统中的MEC服务器仍然要面对大量终端用户设备(User Equipment,UE)的数据处理请求,对于计算和通信资源的分配和调度能力仍然具有较高的要求。 本文为移动边缘计算系统提出了一个高效的基于强化学习的计算和通信资源联合分配算法。为了最大化受益于移动边缘计算的终端设备数量以及最小化终端设备的平均开销,对每个终端设备我们都进行了数据任务卸载与功率控制策略的联合优化。加入功率控制的资源联合分配算法在降低终端设备平均开销方面表现更为突出。然而,对于找到本文提出的两个优化目标的最优解仍然是一个NP难(non-deterministic polynomial hard,NP-hard)问题。所以本文为此建立了一个马尔可夫决策过程(Markov Decision Process,MDP)模型,同时使用了强化学习(Reinforcement Learning,RL)算法来解决该模型。本文使用强化学习中的同步策略控制算法Sarsa和异步策略控制算法Q-Learning与传统的基于接收信号强度(Received Signal Strength,RSS)的资源分配算法进行实验仿真对比。通过实验仿真结果我们可以看出,本文所提出基于强化学习的计算和通信资源联合分配算法相较于传统的穷举算法能够实现近似最优的性能,并且与基于RSS的资源分配算法相比,无论是从整个系统的角度(更多受益于移动边缘计算的终端设备)还是从个体终端用户设备的角度(更少的综合开销)都表现出了更优的性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号