首页> 中文学位 >基于改进模拟退火算法的Hadoop云平台下新型调度器的研究和开发
【6h】

基于改进模拟退火算法的Hadoop云平台下新型调度器的研究和开发

代理获取

目录

声明

摘要

第一章 绪论

1.1 课题背景与意义

1.2 国内外研究现状

1.3 本文研究的目标与内容

1.4 论文组织结构安排

第二章 Hadoop云计算平台

2.1 Hadoop平台简介

2.1.1 Hadoop与MapReduce

2.1.2 Hbase数据管理

2.1.3 Hive数据管理

2.2 Hadoop下多种调度器介绍及分析

2.2.1 默认调度器FIFO Scheduler

2.2.2 公平调度器Fair Scheduler

2.2.3 计算能力调度器Capacity Scheduler

2.2.4 资源感知调度器Resource Aware Scheduler

2.2.5 自适应调度器Adaptive Scheduler

2.3 本章小结

第三章 Hadoop平台下新型调度器的设计与开发

3.1 关键技术

3.1.1 Hadoop调度框架

3.1.2 Hadoop调度器编写

3.2 新型调度器的设计思想

3.2.1 计算能力调度器原理及问题

3.2.2 模拟退火算法的原理

3.2.3 改进的调度策略

3.3 新型调度策略的伪代码

3.4 本章小结

第四章 基于新调度器的Hadoop平台实现

4.1 Hadoop平台下调度器的切换

4.2 调度器的功能模块划分

4.3 新型调度器各功能模块的实现

4.3.1 调度器类与监听器类的实现

4.3.2 新型调度器NewScheduler的配置

4.4 本章小结

第五章 基于新型调度器的云计算平台测试

5.1 测试目的

5.2 测试环境

5.3 测试内容

5.4 测试过程与结果

5.4.1 调度器切换

5.4.2 一般性大内存作业的调度情况对比

5.4.3 超高型大内存作业的调度情况对比

第六章 总结与展望

6.1 本文工作总结

6.2 未来工作的展望

参考文献

致谢

攻读学位期间发表的学术论文目录

展开▼

摘要

当下,随着“云计算(Cloud Computing)”平台的火热发展,越来越多的高校、研究所、IT公司以及互联网企业开始深入研究并开展云平台的项目,以求能更好地面对“大数据(Big Data)”时代的来临。而在这其中,ApacheHadoop作为完全开源的云平台,受到了大多数企业,工程师以及专家学者的青睐,纷纷参与到了Hadoop云计算平台的研究和开发中。
  而随着“云计算”的火热发展,“云服务”供应商正在面临着越来越巨大,越来越复杂的数据处理。各种PB级别的结构化和非结构化数据让现有的Hadoop平台处理起来非常地吃力。此时,原生Hadoop在某些特殊作业的背景下已经难以有效地应对用户所提交的各种复杂任务了。
  本文正是针对目前Map Reduce框架下Hadoop现有调度器在处理大内存需求作业时出现的任务等待时间过长,作业完成时间过高等问题,研究了不同调度器的调度策略,提出并设计了基于模拟退火算法的队列级别调度策略。通过采用队列资源利用率作为退火概率,将作业期望完成时间、资源量限制等作为设计参数,利用模拟退火算法的高效率、低初始条件约束等特点,优化计算能力调度器的调度效果。本文所做工作如下:
  首先,针对目前的Hadoop平台,分析,研究了Hadoop的设计理念,运行机制,掌握了MapReduce的处理框架,并对Hadoop现有调度器进行了深人的学习,包括Hadoop默认的FIFO先进先出调度器,Hadoop中自带的公平调度器,计算能力调度器,以及在MapReduce事项列表中正式提出且已设计出但尚未在Hadoop2.0之前的版本中正式使用的资源感知调度器和自适应调度器。针对以上五种调度器,探讨了它们的设计理念,并对它们的调度机理进行了研究和分析,指出了目前各种调度器中所存在的不同问题。
  然后,根据之前的工作中所总结的在现有各种调度器中所存在的普遍问题,本文提出并设计了一种新型的调度器,能有效地解决之前调度器中所存在的对大内存需求作业调度吃紧的问题。设计思路采用改进型的模拟退火算法,首先对传统的模拟退火算法进行了分析,之后对如何在调度器中应用给出了改进方法,根据Hadoop平台下的调度器原理进行了基于模拟退火算法新型调度策略的设计并依据该策略开发了新型的Hadoop调度器。
  最后,本文对新型调度器进行了实际情况测试,包括Hadoop中实现调度器的自由切换,针对不同类型作业的调度情况测试,在同一种作业下与计算能力调度器的调度对比测试等等。经过实验验证,本文所设计的新型调度器对大内存需求作业进行调度时能有效地降低任务等待情况的发生,实现了更低的作业完成时间以及更好的资源利用率。基本实现了hadoop调度器所需要的功能,同时也能满足特殊情况下作业的合理调度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号