首页> 中文学位 >面向粗粒度动态可重构处理器的通用领域算法实现与优化
【6h】

面向粗粒度动态可重构处理器的通用领域算法实现与优化

代理获取

目录

第一个书签之前

摘 要

ABSTRACT

绪论

课题研究背景

可重构计算技术概述

可重构计算的分类

可重构处理器硬件架构

可重构计算面临的挑战

本文主要工作和创新点

论文组织结构

粗粒度动态可重构处理器体系结构

可重构阵列执行流程

片上共享存储器

可重构阵列

计算单元

小结

算法映射优化措施

映射原则

通过空间映射构建硬件流水线

多层循环的映射

其它优化方式

流处理范式

Ping-Pong Shared Memory

源代码的循环变换

小结

基准测试程序集在可重构平台的实现

完全流水化映射

非结构化网格算法映射

其他算法的映射

不完全流水化映射

多体问题算法映射

字符串匹配算法映射

其他算法的映射

小结

实验结果与分析

算法性能

性能与瓶颈分析

小结

结论与展望

工作总结

未来研究方向

致谢

参考文献

作者在学期间取得的学术成果

展开▼

摘要

可重构处理器是通用处理器与专用处理器的折中,同时具有通用处理器的灵活性与专用处理器的高能效。相比于细粒度可重构处理器FPGA,粗粒度动态可重构处理器(Coarse-grained Reconfigurable Architecture, CGRA)在芯片功耗、配置文件尺寸和配置时间开销上具有先天优势,成为研究热点。
  粗粒度动态可重构技术远未成熟,市场上还没有大规模应用的相关产品,但其适中的灵活性、高能效性能够弥补通用处理器和专用处理器的缺陷,前景广阔。然而,粗粒度可重构体系结构在提高灵活性、降低功耗的同时,加剧了并行编程难度。并且,现有的粗粒度可重构处理器只适用于特定领域的应用。在此基础上,本课题的研究拟解决的关键技术问题为通用领域算法在粗粒度可重构体系结构上的高效映射。
  本文的主要工作分为三个部分。
  第一,以伯克利大学提出的应用类型全覆盖的13类Dwarfs为指导,精选出一套覆盖13类Dwarfs的kernel级别的benchmark,从而能够在目标可重构平台进行实现,并可以与CPU平台进行性能比较。
  第二,通过对可重构体系结构以及处理器编程模型的分析,提出了算法映射的系列优化措施,包括流水化映射、多层嵌套循环的映射等,并将测试程序集的13个算法以最优化方法在可重构处理器平台实现。
  第三,为了体现映射结果的合理性、有效性,将测试程序集在英特尔Atom平台运行并收集性能数据,与可重构平台的映射结果进行性能比较,结果显示,在当前可重构处理器的模拟环境下,性能对于Atom具有显著优势。
  综上所述,本文面向粗粒度动态可重构体系结构,针对通用领域算法在可重构处理器上的高效映射问题提出了有效的优化方法,并在粗粒度动态可重构平台进行了验证,对于可重构体系结构和可重构处理器编译器的设计具有一定的理论意义和应用价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号