首页> 外文会议>International Symposium on Computer Architecture and High Performance Computing Workshop >Performance Optimization for SpMV on Multi-GPU Systems Using Threads and Multiple Streams
【24h】

Performance Optimization for SpMV on Multi-GPU Systems Using Threads and Multiple Streams

机译:使用线程和多流的多GPU系统上SpMV的性能优化

获取原文

摘要

Sparse matrix-vector multiplication (SpMV) is a key operation in scientific computing and engineering ap-plications. This paper presents an optimization strategy to improve SpMV performance on the multi-GPU systems by adopting OpenMP threads and multiple CUDA streams. We propose an efficient scheme to control multiple GPUs jointly complete SpMV computations by making use of OpenMP threads. Moreover, we adopt streamed approach to increase concurrency to further improve SpMV performance. In our paper, we use HYB (Hybrid ELL/COO), a hybrid sparse storage format, to demonstrate the effectiveness of our proposed approach. Our experimental results show that our approach achieves an average speedup of 3.80 over the existing SpMV implementation on a single GPU.
机译:稀疏矩阵向量乘法(SpMV)是科学计算和工程应用中的关键操作。本文提出了一种优化策略,以通过采用OpenMP线程和多个CUDA流来提高多GPU系统上的SpMV性能。我们提出了一种有效的方案,通过使用OpenMP线程来控制多个GPU共同完成SpMV计算。此外,我们采用流式方法来增加并发性,以进一步提高SpMV性能。在本文中,我们使用混合稀疏存储格式HYB(混合ELL / COO)来证明我们提出的方法的有效性。我们的实验结果表明,与在单个GPU上现有的SpMV实现相比,我们的方法可实现平均3.80的加速。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号