首页> 中文会议>2017年全国高性能计算学术年会 >基于ARM V8平台的二维FFT实现与优化研究

基于ARM V8平台的二维FFT实现与优化研究

摘要

ARMV8架构是最新一代的ARM架构,它加入了64位和32位执行状态,可以设计更高性能的处理器实现方案.FFT(快速傅里叶变换)是用于计算离散傅里叶变换(DFT)或其逆运算的快速算法,它广泛应用于工程,科学和数学计算.到目前为止,鲜有基于ARM平台的高性能FFT算法的实现和优化,然而,随着ARM V8处理器应用的日益广泛,研究FFT算法在ARM平台上高性能实现日益重要.本文在ARMV8平台上实现和优化了一个高性能的二维FFT算法库:PerffFT,通过FFT蝶形的计算优化、SIMD优化、汇编与寄存器使用优化、小规模输入的特殊优化、内存对齐、Cache-aware的分块算法和高效转置等优化方法的应用,大大提升了FFT算法的性能.实验结果表明,PerffTT相比目前应用最为广泛的开源FFT库FFTW3.3.6实现了10%~216%的性能提升,而相比ARM高性能商业库ARM Performance Library实现了13%~44%的性能提升.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号