3D-MMA:基于3D集成电路的矩阵乘加速结构

王吉军; 郝子宇; 李宏亮

首页> 中文期刊> 《计算机工程与科学》 >3D-MMA:基于3D集成电路的矩阵乘加速结构

3D-MMA:基于3D集成电路的矩阵乘加速结构

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

cqvip:脉动阵列结构规整、吞吐量大,适合矩阵乘算法,广泛用于设计高性能卷积、矩阵乘加速结构。在深亚微米工艺下,通过增大阵列规模来提升芯片计算性能,会导致频率下降、功耗剧增等问题。因此,结合3D集成电路技术,提出了一种将平面脉动阵列结构映射到3D集成电路上的双精度浮点矩阵乘加速结构3D-MMA。首先,设计了针对该结构的分块映射调度算法,提升矩阵乘计算效率;其次,提出了基于3D-MMA的加速系统,构建了3D-MMA的性能模型,并对其设计空间进行探索;最后,评估了该结构实现代价,并同已有先进加速器进行对比分析。实验结果表明,访存带宽为160 GB/s时,采用4层16×16脉动阵列的堆叠结构时,3D-MMA计算峰值性能达3 TFLOPS,效率达99%,且实现代价小于二维实现。在相同工艺下,同线性阵列加速器及K40 GPU相比,3D-MMA的性能是后者的1.36及1.92倍,而面积远小于后者。探索了3D集成电路在高性能矩阵乘加速器设计中的优势,对未来进一步提升高性能计算平台性能具有一定的参考价值。

著录项

来源
《计算机工程与科学》 |2019年第12期|2110-2118|共9页
作者
王吉军; 郝子宇; 李宏亮;
展开▼
作者单位

江南计算技术研究所江苏无锡 214083;

展开▼
原文格式 PDF
正文语种 chi
中图分类设计与性能分析;
关键词
3D集成电路; 矩阵乘; 分块算法; 性能模型;

相似文献

中文文献
外文文献
专利

1. 3D-ACC:基于3D集成电路的卷积神经网络加速结构研究 [J] . 王吉军 ,郝子宇 ,李宏亮 . 计算机应用研究 . 2020,第012期
2. 基于加速度二次协方差矩阵和神经网络的结构损伤识别 [J] . 刘军香 ,王立新 ,姜慧 . 地震工程与工程振动 . 2019,第3期
3. 基于加速度二次协方差矩阵参数变化比法的环境振动下结构损伤识别 [J] . 王立新 ,李雪艳 ,姜慧 . 振动与冲击 . 2016,第008期
4. 基于3D-cube结构的卷积神经网络硬件加速 [J] . 隋远峰 ,常亮 ,赵思濛 . 微电子学与计算机 . 2021,第8期
5. 大科学工程组织结构评价与选择——基于弱矩阵、平衡矩阵和强矩阵组织结构的对比 [J] . 张光军 ,吕紫瑜 ,刘人境 . 科技进步与对策 . 2019,第013期
6. 基于加速退化数据的集成电路可靠性评估 [C] . 王超 ,李凌 ,胡圣 . 2013年航天可靠性学术交流会 . 2013
7. 基于秩结构矩阵的矩量法加速算法研究 [A] . 余维康 . 2017

3D-MMA:基于3D集成电路的矩阵乘加速结构

摘要

著录项

相似文献

相关主题

期刊订阅