首页> 中文学位 >基于FT-Matrix2的自动向量化关键技术研究与实现
【6h】

基于FT-Matrix2的自动向量化关键技术研究与实现

代理获取

目录

声明

第一章 绪论

1.1 研究背景

1.2 自动向量化简介及研究现状

1.3 开发平台选择

1.4 论文的主要工作

1.5 论文结构和组织

第二章 GCC自动向量化框架分析

2.1 GCC编译结构分析

2.2自动向量化的的框架分析

2.3 本章小结

第三章 基于FT-Matrix2的自动向量化实现

3.1 FT-Matrix2体系结构

3.2 FT-Matrix2向量后端移植

3.3 FT-Matrix2向量指令实现

3.4 本章小结

第四章 基于FT-Matrix2的向量访存实现

4.1 FT-Matrix2向量访存介绍与分析

4.2 自动向量化的向量访存实现过程

4.3 基于DMA自动传输的向量访存实现

4.4 基于SVR传输的向量访存实现

4.5 本章小结

第五章 基于FT-Matrix2的FFT算法的自动向量化实现

5.1 FFT算法介绍及分析

5.2 实验结果及性能分析

5.3 本章小结

第六章 总结与展望

6.1 全文总结

6.2 展望

致谢

参考文献

作者在学期间取得的学术成果

展开▼

摘要

FT-Matrix2 DSP是国防科技大学微电子所自主研发的一款面向图像处理、视频和无线通信的高性能 DSP。其采用向量和多发射超长指令字体系结构。其中, SIMD指令在 FT-Matrix2指令集中的数量占比达到了近50%,而这些指令是芯片整体性能得到提升的关键。因此,FT-Matrix2编译器中 SIMD向量化能力直接影响着芯片的运行效率。
  本文基于GCC平台研究并实现了FT-Matrix2编译器的自动向量化技术。本文根据FT-Matrix2体系结构特征,通过添加FT-Matrix2向量后端支持以及在自动向量化过程中增加DMA自动传输实现向量访存等技术,使得 FT-Matrix2编译器能够尽量挖掘用户 C程序的自动向量化部分,从而提高芯片的运行效率。本文的主要工作包括以下几个方面:
  (1)对 GCC的编译结构、自动向量化框架进行了深入的分析。首先熟悉了GCC的结构框架,然后定位了自动向量化优化在GCC内部的位置,最后分析了自动向量化的的结构框架。通过对上述问题的深入分析,确定了基于GCC平台实现FT-Matrix2的向量化方法和步骤。
  (2)基于FT-Matrix2体系结构和指令集,在GCC中实现了SIMD指令自动向量化映射。其主要工作包括:添加向量寄存器描述,向量数据机器模式,向量指令描述,汇编输出等。
  (3)基于 FT-Matrix2的自动向量化访存实现。基于 FT-Matrix2体系结构向量访存的特点,在GCC中实现了基于DMA的自动数据传输功能,使得编译器能够根据向量程序要求自动生成向量数据搬移代码,实现了 FT-Matrix2自动向量化的向量访存。
  (4)基于本文的研究工作,对DSP常用算法FFT进行了自动向量化实现,测试结果表明:基于FT-Matrix2 Compiler的自动向量化较-O2级优化非向量化性能有明显的提高,而较intrinsic方式向量化性能较低。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号