首页> 中文学位 >基于异构计算的泛Kriging算法并行化研究
【6h】

基于异构计算的泛Kriging算法并行化研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪 论

1.1 研究背景与意义

1.2 国内外研究现状

1.3 研究内容和技术路线

1.4 本文结构安排

第二章 泛Kriging插值算法与OpenCL

2.1 空间插值算法简介

2.2 空间插值算法的分类与常用算法介绍

2.3 常用空间插值算法的优劣对比

2.4 Kriging插值

2.5 异构计算介绍

2.6 OpenCL开发语言介绍

2.7 本章小结

第三章 泛Kriging算法串行实现与热点分析

3.1 泛Kriging算法串行程序实现

3.2 泛Kriging串行程序正确性验证

3.3 泛Kriging算法串行程序热点分析

3.4 本章小结

第四章 泛Kriging算法并行化实现

4.1 串行程序并行化分析

4.2 平台模型实现方面

4.3 执行模型实现方面

4.4 内存模型实现方面

4.5 编程模式实现方面

4.6 多设备时的负载均衡策略

4.7 并行程序正确性验证

4.8 本章小结

第五章 泛Kriging算法串并行程序性能分析

5.1 实验环境配置详情

5.2 测试方法及过程

5.3 实验结果及分析

5.4 实验结论

5.5 本章小结

第六章 全文总结与展望

6.1 本文的主要贡献

6.2 后续工作及展望

致谢

参考文献

攻读硕士学位期间取得的成果

展开▼

摘要

Kriging插值算法是一种最优的线性无偏空间插值算法,并被广泛应用在采矿学、水文地质学、环境科学、遥感学等领域。在一些大规模的工程应用中,需要Kriging算法处理的数据量日益庞大,且其计算量随着数据的规模增大而呈指数级上升,造成串行Kriging算法在应用中的性能瓶颈问题。采用集群、多核/众核的并行Kriging插值算法是解决这类问题的主要手段,然而这些研究却存在1)基于集群的Kriging并行算法存在线性扩展性较差、能源消耗过大的问题;2)基于多核的Kriging并行算法本身面临多核架构并不是针对计算密集型应用而设计的硬伤,算法的效率与适用性存在缺陷;3)已有基于众核的GPU算法存在局限于特定平台,其可移植性、通用性较差问题。
  随着计算技术的不断进步与发展,异构计算以其强大计算能力、较强的通用性、可扩展性而崭露头角。针对上述所面对的问题,本研究基于异构平台(CPU+GPU/MIC),利用OpenCL编程模型探索了泛Kriging插值算法在异构计算平台上的并行化途径及方法。主要工作和研究内容包括:
  (1)研究泛 Kriging算法原理并对其进行了串行实现,选定插值算法的评价参数,将串行程序与专业地学软件进行插值结果对比,验证了串行程序的正确性。
  (2)利用专业程序性能分析工具进行了串行程序的热点分析,定位了串行程序的热点所在,并针对此热点进行了并行化框架的设计与程序实现,通过对比实验测试与分析,验证了并行程序的有效性。
  (3)对并行程序运行于单计算设备的情况进行了应用扩展,实现了在多设备存在时任务调度的动态负载策略,使其在实际的单/多设备应用环境均具有适用性,实现了泛Kriging算法在多设备上的并行化研究。
  最后,通过在两种不同的专业高性能计算平台GPU和Intel Xeon Phi上进行插值数据规模、搜索邻近点个数、像元大小的参数变换,记录串、并行程序的实验运行结果,得到了并行程序的加速比性能指标,并对结果进行分析得到了相应的结论。实验结果表明:所设计的泛Kriging并行算法在高性能计算平台GPU平台上获得了很好的处理速度及运算性能,并行化部分的加速比获得了40x以上的加速比,总程序加速比在很多时候也以接近理论峰值加速比运行;通过与不同的异构平台Intel Xeon Phi上的实验对比,表明了并行程序不仅具有很好的加速效果,而且具有跨平台移植的特性;当平台上存在多个计算设备时,采用动态负载均衡策略实现的并行程序运行结果表明,利用多个设备得到的加速比结果与单个设备相比基本呈线性关系增长,最高获得了80x以上的加速性能。
  总之,该研究为在异构平台上进行地学算法的设计与应用提供了参考与借鉴,具有一定的指导意义及研究价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号