您现在的位置：首页> 研究主题> 矩阵乘法

矩阵乘法

矩阵乘法的相关文献在1979年到2022年内共计411篇，主要集中在自动化技术、计算机技术、数学、无线电电子学、电信技术等领域，其中期刊论文200篇、会议论文7篇、专利文献19462篇；相关期刊150种，包括高师理科学刊、当代电大、内蒙古电大学刊等；相关会议7种，包括2016中国计算机辅助设计与图形学会大会、军队院校数学课程创新教学研讨会、2012全国高性能计算学术年会等；矩阵乘法的相关文献由864位作者贡献，包括王绍迪、刘仲、田希等。

矩阵乘法—发文量

期刊论文>

论文：200篇占比：1.02%

会议论文>

论文：7篇占比：0.04%

专利文献>

论文：19462篇占比：98.95%

总计：19669篇

矩阵乘法—发文趋势图

矩阵乘法
-研究学者

王绍迪
刘仲
田希
郭阳
彭元喜
扈啸
陈书明
陈海燕
顾静相
不公告发明人
何雷骏
刘胜
徐斌
王开兴
顾乃杰
A·阿克里博
R·凡伦天
万江华
克里斯·马丁
吴家铸
孙永节
王永文
田翔
窦强
谢林川
阿祖拉·普利梅诺
陈磊
陈耀武
陈跃跃
龚国辉
M·J·查尼
于佳
何颂颂
刘进锋
周德俊
安德鲁·埃弗里特·菲尔普斯
崔翔
朱海涛
李晓雯
王勇
诺曼·保罗·约皮
陈佳升
鲁华祥
黄乐天
龚国良
A·K·米什拉
A·杨
A·苏普鲁恩
A·阿马迪
B·乔杜里

矩阵乘法
-相关主题

矩阵乘法
-相关期刊

矩阵乘法
-相关会议

期刊论文
会议论文
专利文献

搜索

排序：

专利类型

专利分类

学科

年份

2022
(61)
2021
(43)
2020
(7)
2019
(6)
2018
(8)
2017
(7)
2016
(12)
2015
(11)
2014
(14)
2013
(9)
2012
(13)
2011
(9)
2010
(9)
2009
(8)
2008
(6)
2007
(6)
2006
(4)
2005
(2)
2004
(3)
2003
(2)
2002
(2)
2001
(5)
2000
(2)
1999
(5)
1998
(2)
1997
(4)
1996
(3)
1995
(11)
1994
(3)
1993
(3)
1992
(3)
1991
(1)
1990
(1)
1989
(2)
1987
(1)
1984
(1)
1983
(1)
1979
(1)

期刊

收录数据库

作者

关键词

申请/权力人

;

1. 使用OpenMP+MPI的矩阵乘法并行实现
- 苟悦宬
- 摘要：为了提升矩阵乘法的运算速度,优化运算性能,提出了一种基于并行计算的方法。采用OpenMP+MPI混合编程,选用华为鲲鹏处理器和PC机作为实验平台。其中MPI将分块后的小矩阵广播至每个进程,在每个进程中使用OpenMP进行矩阵相乘的运算,再使用MPI进行运算结果的聚集,最后显示时间性能等相关信息。分别选用PC机,单台和多台华为鲲鹏服务器,分配不同的进程数,对运算结果进行了相关性能的分析与总结。
2. 浅谈GRU算法在基于Session的推荐系统的应用与优化
- 高峰
- 摘要：当今社会随着网络的发展和移动平台的应用,移动端的应用需求大量增加,数据需求增长迅猛,但是数据的相关处理却不能及时同步,因此产生了数据过载等情况。而推荐系统能够有针对性的处理这些难题,推荐算法则是系统中最重要的核心,一个推荐算法的优劣很大程度上影响了系统的运行效率。传统的几种推荐方式各自在某些方面存在一些局限性,而GRU同时考虑了时间的影响和item的特征,所以相比于传统的其他几种推荐方法表现会更好。同时通过结合一些矩阵分解的方式来进一步优化算法,以达到更好的效果。研究GRU算法在基于Session的推荐系统中的应用及优化方案,可以带动目前各主流电商等平台中相关技术的更新,对商家的销售策略制定提供强有力的数据支撑,对经济起到积极的刺激和推动作用。主要是对GRU算法在基于Session的推荐系统中的应用和优化进行分析和研究,以供相关专业人士进行参考和借鉴。
3. 面向TensorFlow和PyTorch的线性代数基准测试
- 胥凌
- 摘要：传统的高性能线性代数计算库如BLAS需要开发者具备丰富的性能优化经验,使用困难。TensorFlow、Pytorch等AI框架提供了简单的开发接口,促进了机器学习应用的发展。这些AI框架大量进行线性代数计算,但是不清楚其是否针对线性代数计算进行了性能优化。设计了一组线性代数计算测试程序,评估了AI框架对的线性代数计算的优化程度。分析显示AI框架在计算图模型下可以有效去除冗余子表达式,但仍然缺少自动识别矩阵链最佳括号的相关优化。未来AI框架可以通过吸收现有高性能线性代数加速库的优化技术进一步提升性能。
4. 基于多面体模型的矩阵乘法向量代码生成
- 王博漾；庞建民；徐金龙；赵捷；陶小涵；朱雨
- 摘要：矩阵乘法是众多科学计算的核心,而向量化编程是提升其性能的主要手段之一。针对现有的向量化优化往往存在需要手工进行调优以及与硬件结构映射的问题,基于多面体编译器PPCG,在多面体模型中引入向量代码生成框架,提出了基于多面体模型的矩阵乘法向量代码生成框架。通过对矩阵乘法的向量化方案进行收益分析来确定向量化方案,指导应用框架的代码生成,基于该代码生成框架,有利于矩阵乘法的向量化快速优化。选取13个规模在64×64×64到1 024×1 024×1 024之间的矩阵乘法用例进行实验,结果表明,该框架能够正确生成向量化代码,与基础编译器ICC的自动向量化功能相比,应用该框架生成的向量化代码最高获得了5.09倍的加速和3.39倍的平均加速。
5. 问题驱动下的线性代数教学探究
- 张文彬
- 摘要：问题驱动下的教学,是以学生为主体的教学模式,侧重于引导学生通过自主学习探索知识.文章讨论了线性代数教学的现状,从简单的实际例子出发,以问题驱动的方式探讨矩阵乘法运算所需要满足的运算规则,逐步将例子推广至两个矩阵乘法的定义;同时,也利用问题驱动的方式探讨了逆矩阵概念的教学.
6. 一种基于NoC多核系统的矩阵乘法映射技术
- 汪杨；王晓蕾；袁子昂；袁儒明
- 摘要：矩阵乘法是现代信号处理的基本运算,提高数据的并行处理能力对提升矩阵乘法的运算性能具有重要现实意义.文中在基于NoC多核系统中针对不同维度的矩阵乘法的密集型计算进行任务调度以及资源分配,实现了多种适应于不同矩阵乘法的映射方案,其峰值性能可达5078 MFLOPS.同时,文中设计的运算单元相对独立且可重构,对任意维度的矩阵乘法具有良好的扩展性和通用性,解决了通用矩阵乘法器在固定结构中受到I/O带宽和计算资源的限制而产生的运算效率较低和扩展性较差的缺陷.不同维度矩阵乘法的实验结果分析证实了文中设计的运算性能和正确性.
7. 面向大规模矩阵乘法的编码计算性能研究
- 王艳；王希龄；赖宏达；李念爽
- 摘要：为了更好地使用编码计算提高分布式机器学习算法运行效率,需要对大规模矩阵乘法的编码计算方案性能开销进行充分的研究.该文考察了面向大规模矩阵乘法的编码计算方案的任务完成时间,同时也考虑了所有参与分布式计算的节点总的计算开销,给出了各个工作节点完成计算任务的时间,均匀分布场景下总的任务完成时间和集群机器总的计算时间的表达式,对比分析了3种编码方案的性能,并通过实验对比了不同情况对任务完成时间与计算节点总计算开销影响,提出了一个启发式算法,提供了不同编码计算方案的选择依据.
8. "三教"改革背景下矩阵乘法的教学设计
- 王晓平；阮杰昌；任建英
- 摘要： "三教"改革背景下对教师的教学设计提出了更高要求.在矩阵乘法的教学设计中推陈出新,采用了先通过实例创设情境引出本次课重点内容,并通过恰当的问题引导法逐步引导学生探索矩阵乘法的运算规则,再通过例题计算让学生自己总结归纳其运算规律,利用特殊矩阵乘法进行拓展,利用矩阵乘法解决实际问题.这种教学设计符合学生的认知规律,让学生在动手解题过程中逐渐建构起矩阵乘法运算方法.
9. 邻接矩阵及其幂运算在韩信立马分油问题中的应用
- 李静；黄丽芹；李晓丽
- 摘要：针对韩信分油问题,先尝试可能的变化过程,并用状态向量表示;而后用matlab画出有向图;最后利用邻接矩阵的幂次方得到分油方案的最少步数并给出具体操作步骤.
10. 基于FPGA的卷积神经网络加速器动态余数处理映射模型
- 赵小强；姜晶菲；许金伟；窦勇
- 摘要：将卷积计算转化为矩阵乘法是FPGA上一种高效实现,而现有的转化方法无法根据卷积参数的不同动态调整,限制了卷积计算的并行度.提出一种新的动态余数处理映射模型.该映射模型包含有3个子模型:特征值映射模型,权值映射模型,和输出映射模型.特征值映射模型将特征值转化为特征值矩阵,权值映射模型将权值转化为权值矩阵,特征值矩阵和权值矩阵通过乘累加计算阵列得到卷积计算结果,由输出映射模型将卷积计算结果存储到内存中.在卷积计算过程中,卷积的输出通道数通常不是乘累加计算阵列行数的整数倍,3个子映射模型会根据产生的余数动态调整映射方法,提高乘累加计算阵列的利用率.通过实验表明,采用动态余数处理映射模型能够将余数并行度的倍数至多提高到卷积核大小,使整个加速器达到了更高的实际吞吐量和能量效率.

1. 使用16比特浮点乘法器的矩阵-矩阵乘法的多精度整数乘法器
- 国际商业机器公司
- 公开公告日期：2020-10-20
- 摘要：提供了计算机实现的方法、计算机程序产品和装置。该方法包括将通过在第一数位方向上划分表示第一整数的第一整数数据而获得的多个第一整数元素当中的N×N个第一整数元素代入到具有N行和N列的第一矩阵中。该方法还包括将通过在第二数位方向上划分表示第二整数的第二整数数据而获得的多个第二整数元素当中的一个或多个第二整数元素中的每个代入到具有N行和N列的第二矩阵中的至少一个矩阵元素中。该方法还包括计算第三矩阵，第三矩阵是第一矩阵和第二矩阵的乘积。该方法包括输出第三矩阵中的每个矩阵元素作为第一整数和第二整数的乘积的计算中的部分乘积。
2. 基于矩阵的帧内预测（MIP）的矩阵乘法过程
- 瑞典爱立信有限公司
- 公开公告日期：2022-04-15
- 摘要：一种用于预测当前块的样本的MIP方法（700）。该方法包括存储（s702）MIP权重矩阵的集合。该方法还包括确定（s704）当前块的宽度W和高度H。该方法进一步包括作为i）确定W=4和H=16或ii）确定W=16和H=4的结果，将mipSizeId变量设置（s706）为1。该方法进一步包括存储（s708）规定当前块的MIP预测模式的值predModeIntra。该方法进一步包括基于predModeIntra和mipSizeId变量的值来确定（s710）modeId值。并且该方法进一步包括从MIP权重矩阵的集合中选择（s712）要用于当前块的MIP权重矩阵，其中该选择基于modeId和mipSizeId变量的值。
3. 一种矩阵乘法器的实现方法及矩阵乘法器装置
- 广东省新一代通信与网络创新研究院
- 公开公告日期：2021.08.10
- 摘要：本发明公开了一种矩阵乘法器的实现方法，方法包括：配置第一乘法运算模块、第二乘法运算模块、保留进位加法运算模块和超前进位加法运算模块；将待运算的多个乘数根据矩阵乘法运算的需求分割成满足第一乘法运算模块和第二乘法运算模块所需的小矩阵；通过小矩阵进行矩阵的乘法运算生成多个部分积；通过保留进位加法运算模块对多个部分积根据不同的权重进行压缩至两个部分积；通过超前进位加法运算模块对两个部分积进行运算生成用于组成矩阵乘法结果的元素。根据本发明公开的方法能够减少矩阵运算所需的时钟周期，提高了计算模块的利用效率，减少了运算资源的浪费。
4. 通用矩阵-矩阵乘法数据流加速器半导体电路
- 三星电子株式会社
- 公开公告日期：2022.06.14
- 摘要：本发明公开一种包括智能三维堆叠动态随机存取存储器架构的通用矩阵‑矩阵乘法(GEMM)数据流加速器半导体电路。所述通用矩阵‑矩阵乘法数据流加速器半导体电路包括：存储器存储体；外围查找表，存储在存储器存储体中；以及第一向量缓冲器，存储用作查找表中的行地址的第一向量。所述电路包括第二向量缓冲器及查找表缓冲器，第二向量缓冲器存储用作查找表中的列地址的第二向量，查找表缓冲器从查找表接收并存储查找表表项。所述电路还包括求取第一乘积与第二乘积的和的加法器以及存储所述和的输出缓冲器。查找表缓冲器确定第一向量与第二向量的乘积而不实行乘法运算。实施例包括用于减小潜伏时间的分级查找架构。累积结果以脉动方式传播。
5. 一种用于矩阵乘法密集型算法的可重构矩阵乘法加速系统
- 华中科技大学
- 公开公告日期：2021-02-23
- 摘要：本发明公开了一种用于矩阵乘法密集型算法的可重构矩阵乘法加速系统，包括：缓存器、可重构矩阵乘法控制器、存储控制器、数据存储器和可重构运算阵列；本发明通过可重构矩阵乘法控制器预先统计矩阵乘法密集型算法中所有进行矩阵乘法运算的矩阵尺寸及矩阵乘法运算量，对算法中的各矩阵乘法进行分类，并确定可重构运算阵列的规模及所具有的工作模式，使得当待计算矩阵乘法输入系统中时，基于矩阵尺寸判断矩阵乘法的类别以确定可重构运算阵列的工作模式，并根据该工作模式对应配置存储控制器对矩阵进行分割，同时配置可重构运算阵列中运算单元的互联及可重构运算阵列中的数据流来完成矩阵乘法运算，大大提升矩阵乘法密集型算法中矩阵乘法的运算效率。
6. 一种矩阵乘法器的实现方法及矩阵乘法器装置
- 广东省新一代通信与网络创新研究院
- 公开公告日期：2021-06-25
- 摘要：本发明公开了一种矩阵乘法器的实现方法，方法包括：配置第一乘法运算模块、第二乘法运算模块、保留进位加法运算模块和超前进位加法运算模块；将待运算的多个乘数根据矩阵乘法运算的需求分割成满足第一乘法运算模块和第二乘法运算模块所需的小矩阵；通过小矩阵进行矩阵的乘法运算生成多个部分积；通过保留进位加法运算模块对多个部分积根据不同的权重进行压缩至两个部分积；通过超前进位加法运算模块对两个部分积进行运算生成用于组成矩阵乘法结果的元素。根据本发明公开的方法能够减少矩阵运算所需的时钟周期，提高了计算模块的利用效率，减少了运算资源的浪费。
7. 一种基于FPGA的图神经网络高乘法器利用率的稀疏稠密矩阵乘法阵列
- 中山大学
- 公开公告日期：2022-08-05
- 摘要：本发明公开一种基于FPGA的图神经网络高乘法器利用率的稀疏稠密矩阵乘法阵列，其通过一套乘加法阵列结构，将图神经网络中组合运算中的稀疏稠密乘法拆分，能将源自不同节点，数量不定的有效值累加在一起，得到所需的稀疏稠密矩阵乘法结果。此方法平均每个周期有超过95％乘法器在进行有效运算，且无需复杂的数据预处理，拥有节点特征向量的利用率高，所需乘法器数量较少等优点。
8. 针对矩阵-矩阵乘法分配处理线程
- 慧与发展有限责任合伙企业
- 公开公告日期：2022-05-03
- 摘要：公开了针对矩阵‑矩阵乘法分配处理线程。一种装置，包括处理器和存储指令的存储器。指令当由处理器执行时，使得处理器沿着第一矩阵的第一维度和该矩阵的第二维度执行第一矩阵的线程化。线程化表示用于分配给乘法算法的处理线程的第一矩阵的块大小，乘法算法用于确定表示第一矩阵和第二矩阵的乘积的第三矩阵。块大小包括沿着第一维度的第一块大小和沿着第二维度的第二块大小。第二矩阵与第一矩阵共用第二维度。指令当由处理器执行时，使得处理器向乘法算法提供表示第一块大小和第二块大小的数据。
9. 基于多成像投影架构的光学矩阵-矩阵乘法计算系统及方法
- 中国科学院上海光学精密机械研究所
- 公开公告日期：2022-10-25
- 摘要：本发明提供了一种基于多成像投影架构的光学矩阵‑矩阵乘法计算系统及方法，包括：光源阵列模块，对输入的光学信号加载矩阵A的信息，得到携带矩阵A信息的光学信号；成像投影模块，携带矩阵A信息的光信号经过成像投影模块在x、y两个正交方向上分别得到具有不同位移步长和不同衍射角的子光束阵列；信号调制模块，加载矩阵B的信息，将携带矩阵A的信息的子光束与矩阵B的信息进行点乘操作，得到在不同位置的对应矩阵元素的相乘信息；探测模块，将携带矩阵相乘信息的光学信号进行会聚，实现对应角谱相乘信号的求和操作，得到矩阵‑矩阵相乘结果。相比于之前已经提出的各种光学矢量‑矩阵乘法系统，本发明可以在光域中直接实现两个大规模矩阵的乘法计算，充分利用了光学并行计算的优势，将为人工智能、数据中心、超算中心等具有海量算力需求的任务中对加速超大规模矩阵‑矩阵乘法计算提供通用的、高能效比和高度并行的新解决方法。
10. 用于使用稀疏矩阵的分层表示来加速矩阵乘法计算的技术
- 辉达公司
- 公开公告日期：2022-11-22
- 摘要：公开了用于使用稀疏矩阵的分层表示来加速矩阵乘法计算的技术。一个实施例阐述了一种用于基于第一矩阵和第二矩阵来执行一个或更多个矩阵乘法运算的技术。该技术包括从第一遍历引擎接收与第一矩阵相关联的数据，第一遍历引擎经由第一树结构访问包括在第一矩阵中的非零元素。该技术还包括对与第一矩阵相关联的数据和与第二矩阵相关联的数据执行一个或更多个计算以产生多个部分结果。该技术还包括将多个部分结果组合成一个或更多个中间结果并且将一个或更多个中间结果存储在第一缓冲存储器中。

矩阵乘法

矩阵乘法—发文量

矩阵乘法—发文趋势图

矩阵乘法-研究学者

矩阵乘法-相关主题

矩阵乘法-相关期刊

矩阵乘法-相关会议

矩阵乘法
-研究学者

矩阵乘法
-相关主题

矩阵乘法
-相关期刊

矩阵乘法
-相关会议