首页> 中国专利> 基于NVIDIA Kepler GPU汇编指令的单精度矩阵乘优化方法与系统

基于NVIDIA Kepler GPU汇编指令的单精度矩阵乘优化方法与系统

摘要

本发明涉及单精度矩阵乘优化方法,该方法基于NVIDIA Kepler GPU汇编指令,包括:根据A矩阵分块的列长度bm和B矩阵分块的行长度bn对原始矩阵进行分块,每个block处理维度的输出矩阵C;在GPU二级存储上创建4个暂存空间smA,smB,smAx和smBx;从GPU一级存储上的矩阵A读取该smA大小的矩阵到该smA,从矩阵B读取该smB大小的矩阵到该smB;每次从该smA加载一列A矩阵分块数据到寄存器,从该smB加载一行B矩阵分块数据到寄存器,读取该寄存器内容,并运用乘加融合指令做矩阵乘运算,且在做矩阵乘运算的同时,从该GPU一级存储读取下一个该smA的一列到该smAx,并储读取下一个该smB的一行到该smBx;步骤5,做完该smA和该smB的矩阵乘以后,将该smA和该mAx地址互换,将该smB和该smBx地址互换。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-09-06

    发明专利申请公布后的视为撤回 IPC(主分类):G06F9/302 申请公布日:20170517 申请日:20161230

    发明专利申请公布后的视为撤回

  • 2017-06-09

    实质审查的生效 IPC(主分类):G06F9/302 申请日:20161230

    实质审查的生效

  • 2017-05-17

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号