首页> 中文学位 >云环境下科学工作流执行过程中的动态优化
【6h】

云环境下科学工作流执行过程中的动态优化

代理获取

目录

声明

西北师范大学研究生学位论文作者信息

1绪论

1.1研究背景

1.2国内外研究现状

1.4研究目的

1.5论文组织结构

2相关技术介绍

2.1科学工作流介绍

2.2典型的科学工作流

2.3云计算

2.4 Hadoop云平台

2.5本章小结

3马尔可夫预测模型

3.1马尔可夫链的基本概念

3.2马尔科夫预测法

3.3基于马尔科夫过程的负载预测模型

3.4本章小结

4科学工作流的负载自适应任务调度

4.1执行节点的负载承受能力评估

4.2集群负载均衡指标

4.3负载自适应任务调度算法

4.4实验分析

4.5本章小结

5总结与展望

5.1总结

5.2展望

参考文献

致谢

展开▼

摘要

基于大规模计算资源和大容量存储设备的科学实验,已成为科学探索、工程设计和验证的重要手段。科学工作流是一种新的应用泛型,可支持科学实验的自动编排、执行、监控以及追踪,分布协同和资源共享,提高科学实验过程的自动化。与普通的基于业务逻辑的工作流相比,科学工作流是兼具计算密集和数据密集特点。传统计算环境已经很难满足科学工作流对计算资源的要求。云环境因为其计算和存储资源可以无限扩展,可作为科学工作的理想执行环境。
  对于一个实验机构,其科学工作流引擎需要支撑大量的科学工作流的执行,科学工作流执行引擎需要从云运营商租用计算和存储资源。因为科学工作流兼具计算密集和数据密集特点,数据分布并行任务需要在集群上执行。租用云的资源,需要支付一定的费用。由于科学工作流执行的动态性,因此需要知道集群的负载情况,根据负载情况对节点进行动态分配和回收,来实现资源的伸缩。另外集群内各节点资源使用状况各有差异,应根据各节点的资源情况为节点分配任务量,以提高集群负载的均衡性,到达提升工作流的执行效率,节约费用的目的。
  集群负载的均衡调整可基于当前计算资源和工作流的执行状态,具有典型的马尔科夫链的特点,因此本文建立了马尔科夫预测模型,该模型的主要目的是对集群下一时刻负载状态进行预测,以便对集群资源进行动态伸缩。此外,一个集群可能同时处理着不同类型的任务,不同的任务类型对资源的需求量也是不同的,在此基础上提出了一种负载自适应任务调度策略。该策略根据当前时刻集群负载类型来选取相应的节点负载承受能力评估模型,使集群节点在统一的评估标准下,准确衡量出集群各执行节点负载承受能力,从而更合理地进行任务分配。
  实验结果分析表明,本文提出的方案能够使集群在合适的负载基础上更加合理地为节点分配任务,使得集群到达负载均衡的状态,进一步提升集群资源的利用率和作业的执行效率,并减少了作业的执行费用。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号