首页> 中文会议>2016年全国高性能计算学术年会 >众核平台上LU-SGS共享存储并行算法的性能分析和优化

众核平台上LU-SGS共享存储并行算法的性能分析和优化

摘要

LU-SGS(Lower-Upper Symmetric Gauss-Seidel)是计算流体力学(Computational Fluid Dynamics,CFD)和其它应用领域中求解大型稀疏线性方程组的主要方法.作为典型的高斯-赛德尔迭代算法,其计算模板内的网格点之间有很强的数据依赖性,难以实现共享存储并行,对CFD等应用的MPI+OpenMP混合并行带来了困难.本文针对三维高精度CFD应用,在Intel Ivy Bridge Xeon多核处理器和Xeon Phi众核处理器上对比了流水线以及超线、超平面两类共享存储LU-SGS并行算法.测试表明流水线方法的并行可扩展性优于超线、超平面方法,但在新兴的众核平台上,两类并行算法效率均下降严重.在此基础上,本文提出了两级流水线并行算法(Two-Level Pipeline,TL-Pipeline),有效降低了流水线开销,提升了流水线负载均衡.相对于原始流水线方法,TL-Pipeline在XeonCPU和Xeon Phi上将LU-SGS共享存储并行效率分别提升了多达29%和88%.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号