基于MPI+CUDA异步模型的并行矩阵乘法

刘青昆; 马名威; 阎慰椿

首页> 中文期刊> 《计算机应用》 >基于MPI+CUDA异步模型的并行矩阵乘法

基于MPI+CUDA异步模型的并行矩阵乘法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Matrix multiplication plays an important role in scientific computing. Different structural models can improve the performance of parallel matrix multiplication. In the existing MPI + CUDA synchronization model, the host-side need enter the waiting state and cannot continue to work until the device completes the task, which obviously wastes time. Concerning this question, a parallel matrix multiplication based on MPI + CUDA asynchronous model was proposed. This model prevented host-side's entering into the waiting state, and used CUDA-stream technology to solve the problem of data bulk over GPU memory. By analyzing the speedup ratio and efficiency of the asynchronous model, the experimental results show that MPI + CUDA parallel programming obviously promotes parallel efficiency and large-scale matrix multiplication' s speed, which exerts the advantages of the distributional memory between the nodes and the share memory in the node. It is an effective and feasible parallel strategy.%矩阵乘法在科学计算领域中起着重要的作用,不同结构模型能够改善并行矩阵乘的性能.现有的MPI+CUDA同步模型中,主机端需要进入等待状态,直到设备端完成任务后才能继续工作,这显然浪费时间.针对上述问题,提出一种基于MPI+ CUDA异步模型的并行矩阵乘法.该模型避免了主机端进入等待状态,并采用CUDA流技术解决数据量超过GPU内存问题.通过分析异步模型的加速比和效率,实验结果表明,此方法显著提高了并行效率和大型矩阵乘法的运算速度,充分发挥了节点间分布式存储和节点内共享内存的优势,是一种有效可行的并行策略.

著录项

来源
《计算机应用》 |2011年第12期|3327-3330|共4页
作者
刘青昆; 马名威; 阎慰椿;
展开▼
作者单位

辽宁师范大学计算机与信息技术学院;

辽宁大连 116081;

辽宁师范大学计算机与信息技术学院;

辽宁大连 116081;

辽宁师范大学计算机与信息技术学院;

辽宁大连 116081;

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程;分布式操作系统、并行式操作系统;
关键词
矩阵乘法; 并行计算; 混合编程; 消息传递接口; 统一计算设备架构;

相似文献

中文文献
外文文献
专利

1. 基于MPI＋CUDA的异构并行可压缩流求解器 [J] . 刘枫 ,李桦 ,田正雨 . 国防科技大学学报 . 2014,第001期
2. 基于SMP集群的MPI+CUDA模型的研究与实现 [J] . 许彦芹 ,陈庆奎 . 计算机工程与设计 . 2010,第015期
3. 一种新的基于互连工作站的并行编辑模型：异步远程计算（APC） [J] . 高峰 ,武支耀 ,等 . 电子科技 . 1999,第023期
4. 基于BLACS的2.5D并行矩阵乘法 [J] . 廖霞 ,李胜国 ,卢宇彤 . 计算机学报 . 2021,第005期
5. 基于MPSoC并行调度的矩阵乘法加速算法研究 [J] . 杨飞 ,马昱春 ,侯金 . 计算机科学 . 2017,第008期
6. 基于MPSoC并行调度的矩阵乘法加速算法研究 [C] . Yang Fei ,杨飞 ,Ma Yuchun . 2016中国计算机辅助设计与图形学会大会 . 2016
7. 基于MPI+CUDA并行的相场模型模拟研究 [A] . 邓新 . 2017

基于MPI+CUDA异步模型的并行矩阵乘法

摘要

著录项

相似文献

相关主题

期刊订阅