首页> 中文学位 >基于GPU的图像压缩感知算法并行化研究
【6h】

基于GPU的图像压缩感知算法并行化研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪 论

1.1 研究背景与意义

1.2 国内外研究现状

1.3 研究内容和技术路线

1.4 本论文的结构安排

第二章 压缩感知与OpenCL介绍

2.1 压缩感知理论框架

2.2 压缩感知组成部分

2.3 图像质量评价指标

2.4 并行计算介绍

2.5 图像处理器

2.6 OpenCL异构计算技术

2.7 本章小结

第三章 基于OpenCL的压缩感知重构算法并行设计与实现

3.1 串行算法实现

3.2 算法热点分析

3.3 算法并行模式

3.4 并行算法设计

3.5 并行算法实现

3.6本章小结

第四章 并行算法优化

4.1 并行算法优化

4.2 基于多GPU的重构算法并行设计与实现

4.3 本章小结

第五章 并行算法性能测试与分析

5.1 实验环境

5.2 实验数据

5.3 并行算法结果验证

5.4 并行算法性能评价指标

5.5 实验内容

5.6 测试结果及分析

5.7 本章小结

第六章 全文总结与展望

6.1 全文总结

6.2 后续工作展望

致谢

参考文献

攻读硕士学位期间取得的成果

展开▼

摘要

压缩感知是近几年出现的一种新型信号处理方法,以远低于Nyquist频率对信号同时进行压缩与采样,然后通过求解一个最优化问题就能从少量的观测值中以较高的概率重构出原始信号。它已广泛应用在图像处理领域中的各个方面,如图像融合、去噪、压缩、成像等。目前,这种方法也被引入到遥感图像处理领域中,然而,由于遥感图像具有高分辨率、多时相、数据量大等特点,重构信号时间急剧增加,使得压缩感知理论在遥感图像处理实际应用中存在一定待解决的问题。若仅使用传统CPU进行串行处理,运行时间过长,无法满足人们对算法的实时/准实时处理要求。
  最近几年,GPU计算能力得到很大的提升,具有强大的浮点运算能力,已成为提高算法处理速度最有效的方式之一。CUDA和OpenCL是GPU应用最广泛的两种编程模型。目前,已有相关人员采用CUDA编程模型对压缩感知算法进行并行化研究,但其实现的并行算法只能应用于特定的NVIDIA平台,无法实现并行算法跨平台处理。如采用CUDA实现的并行算法无法在AMD GPU上运行。而后起的OpenCL,作为面向异构系统的开放工业标准,克服了现有的移植性问题,为广泛的科学应用提供了一个理想的异构编程模型。
  因此,本论文利用GPU的并行特性,采用OpenCL编程模型探索了压缩感知算法在GPU平台上并行实现。主要工作与研究内容包含如下:
  (1)理解压缩感知算法的原理,对串行程序进行热点分析,找出算法的性能瓶颈,同时分析算法耗时步骤的可并行性。根据GPU的硬件特性,采用OpenCL编程模型对压缩感知算法进行并行化设计与实现;
  (2)在初步实现的压缩感知并行算法基础上,结合一些常用的优化方法,如指令流优化、访存效率等优化方法,对并行算法做相应优化,进一步加快算法的处理速度;
  (3)目前的并行硬件平台在单个计算节点或单台服务器设备往往部署多个GPU卡,为充分利用节点上的计算资源,需设计合适的任务调度策略,实现压缩感知算法在多GPU卡上的并行研究。
  最后,对上述工作进行实验验证,得到相应的性能效果图。采用不同尺寸的遥感图像对三阶段的并行算法进行实验测试,获取相应的加速比等评价指标,并对结果进行分析得到相应的结论。实验结果表明:在NVIDIA平台上所设计的并行算法有效地提高了压缩感知算法的处理速度,并在此基础上优化的并行算法使加速比得到更进一步地提升;将此并行算法不经任何修改在AMD平台上进行测试,表明其实现的并行算法不仅具有较好的加速效果,而且还具有跨平台可移植性;同时,将并行算法与基于OpenMP实现的并行算法在AMD上的CPU上进行测试,对比两种并行算法的性能;对于多GPU卡实现的并行算法进行实验测试,结果表明两块GPU上实现的并行算法比单GPU处理速度提升了将近两倍。
  本研究在GPU上采用OpenCL语言实现的并行算法具有较好的加速效果,解决了压缩感知算法在实际中应用问题,并对并行计算研究提供一定的指导意义,具有一定的学术研究价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号