基于CUDA编程模型的稀疏对角矩阵向量乘优化

秦晋; 龚春叶; 胡庆丰; 刘杰

首页> 中文期刊> 《计算机工程与科学》 >基于CUDA编程模型的稀疏对角矩阵向量乘优化

基于CUDA编程模型的稀疏对角矩阵向量乘优化

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Sparse matrix-vector multiplication is often an important computational kernel in many scientific applications. This paper faces the n-diagonal sparse matrix, uses the CUDA program model and describes a new compress format of sparse matrix based on the DIA compress format (CDIA), and gives each thread fine-grained task distribution. In order to fulfill the characteristics of the align access of memory in CUDA, we transpose the compress matrix and design a fine-grained algorithm and program and do some optimization to the program. In the data experiment, our best implementation achieves up to 39. 6Gflop/s in single-precision and 19. 6Gflop/s in double-precision, and enhances the performance by about 7. 6% and 17. 4% that of Nathan Bell's and Michael Garland's respectively.%稀疏矩阵向量乘是很多科学计算问题中的核心问题.本文针对稀疏对角矩阵,在DIA存储格式的基础上,设计了一种新型压缩存储格式CDIA,结合CUDA编程模型的特点,在计算线程上进行了细粒度的任务分配,同时为满足CUDA对存储器的合并访问要求,将压缩矩阵做了相应的转置处理,设计了细粒度算法与程序,并根据稀疏矩阵向量乘特点,做了相应的程序优化.实验数据显示,这种存储格式能够很好地发挥CUDA在数据处理方面的优势,在测试数据中,最高获得了单精度39.6 Gflop/s和双精度19.6 Gflop/s的浮点计算性能,性能在Nathan Bell和Michael Garland的基础上分别提高了7.6％和17.4％.

著录项

来源
《计算机工程与科学》 |2012年第7期|78-83|共6页
作者
秦晋; 龚春叶; 胡庆丰; 刘杰;
展开▼
作者单位

国防科学技术大学计算机学院;

湖南长沙410073;

国防科学技术大学计算机学院;

湖南长沙410073;

国防科学技术大学计算机学院;

湖南长沙410073;

国防科学技术大学计算机学院;

湖南长沙410073;

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程;
关键词
GPU; CDIA; CUDA; 稀疏矩阵向量乘;

相似文献

中文文献
外文文献
专利

1. 基于PPR模型的稀疏矩阵向量乘及卷积性能优化研究 [J] . 谢震 ,谭光明 ,孙凝晖 . 计算机研究与发展 . 2021,第003期
2. 基于RISC-V向量指令的稀疏矩阵向量乘法实现与优化 [J] . 顾越 ,赵银亮 . 计算机工程与科学 . 2022,第1期
3. 基于深度学习的稀疏矩阵向量乘运算性能预测模型 [J] . 曹中潇 ,冯仰德 ,王珏 . 计算机工程 . 2022,第2期
4. 基于HYB格式稀疏矩阵与向量乘在CPU+GPU异构系统中的实现与优化 [J] . 阳王东 ,李肯立 . 计算机工程与科学 . 2016,第002期
5. 基于GPU的高性能稀疏矩阵向量乘及CG求解器优化 [J] . 王迎瑞 ,任江勇 ,田荣 . 计算机科学 . 2013,第003期
6. 基于GPU的高性能稀疏矩阵向量乘及CG求解器优化 [C] . WANG Ying-Rui ,王迎瑞 ,REN Jiang-Yong . 2012全国高性能计算学术年会 . 2012
7. 基于FPGA的稀疏矩阵向量乘的优化研究与实现 [A] . 施浩 . 2011

基于CUDA编程模型的稀疏对角矩阵向量乘优化

摘要

著录项

相似文献

相关主题

期刊订阅