...
首页> 外文期刊>Concurrency and Computation >Generating optimal CUDA sparse matrix-vector product implementations for evolving GPU hardware
【24h】

Generating optimal CUDA sparse matrix-vector product implementations for evolving GPU hardware

机译:生成用于不断发展的GPU硬件的最佳CUDA稀疏矩阵矢量乘积实现

获取原文
获取原文并翻译 | 示例
           

摘要

The CUDA model for graphics processing units (GPUs) presents the programmer with a plethora of different programming options. These includes different memory types, different memory access methods and different data types. Identifying which options to use and when is a non-trivial exercise. This paper explores the effect of these different options on the performance of a routine that evaluates sparse matrix-vector products (SpMV) across three different generations of NVIDIA GPU hardware. A process for analysing performance and selecting the subset of implementations that perform best is proposed. The potential for mapping sparse matrix attributes to optimal CUDA SpMV implementations is discussed.
机译:用于图形处理单元(GPU)的CUDA模型为程序员提供了许多不同的编程选项。这些包括不同的内存类型,不同的内存访问方法和不同的数据类型。确定使用哪些选项以及何时使用是不平凡的练习。本文探讨了这些不同选项对例程性能的影响,该例程评估了三代不同NVIDIA GPU硬件之间的稀疏矩阵矢量积(SpMV)。提出了一种用于分析性能并选择性能最佳的实现子集的过程。讨论了将稀疏矩阵属性映射到最佳CUDA SpMV实现的潜力。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号