首页> 中文学位 >基于GPU稀疏矩阵运算优化系统设计与实现
【6h】

基于GPU稀疏矩阵运算优化系统设计与实现

代理获取

目录

第1章 绪 论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 分组策略研究现状

1.2.2 稀疏存储格式研究现状

1.2.3 神经网络加速研究现状

1.3.1 本文主要研究内容

1.3.2 本文结构安排

第2章 稀疏矩阵运算优化系统需求分析

2.1 系统需求分析

2.1.1 角色分析

2.1.2 系统功能性需求

2.1.3 系统非功能性需求

2.2 系统优化总体思路

2.2.1 全连接运算优化总体思路

2.2.2 卷积运算优化总体思路

2.3 本章小结

第3章 面向稀疏矩阵的全连接运算研究

3.1 分组策略研究与优化

3.1.1 分组问题建模

3.1.2 整数分组优化策略

3.1.3 整数分组策略的SpMV算法

3.1.4 实验数据

3.1.5 优化结果与分析

3.2 存储格式研究与优化

3.2.1 稀疏存储格式

3.2.2 存储格式优化策略

3.2.3 合并存储格式的SpMV算法

3.2.4 实验数据

3.2.5 优化结果与分析

3.3 本章小结

第4章 面向稀疏矩阵的卷积运算研究

4.1 传统卷积运算研究与优化

4.1.1 传统卷积运算过程

4.1.2 传统卷积运算优化策略

4.1.3优化结果与分析

4.2 稀疏矩阵乘法研究与优化

4.2.1 传统卷积与矩阵乘法转换

4.2.2 稀疏矩阵乘法优化策略

4.2.3 优化结果与分析

4.3 本章小结

第5章 稀疏矩阵运算优化系统设计与实现

5.1 系统架构设计

5.2 功能模块设计

5.2.1 系统整体功能结构设计

5.2.2 全连接运算加速模块设计

5.2.3 卷积运算加速模块设计

5.3 全连接运算加速模块实现

5.3.1 读取数据功能实现

5.3.2 数据筛选功能实现

5.3.3 数据分组功能实现

5.3.4 合并存储功能实现

5.3.5 输出显示功能实现

5.4 卷积运算加速模块实现

5.4.1 数据生成器实现

5.4.2 运算转换功能实现

5.4.3 传统卷积优化器实现

5.4.4 SpMM卷积优化器实现

5.4.5 输出显示功能实现

5.5 稀疏矩阵运算优化系统测试

5.5.1 测试环境

5.5.2 功能测试

5.5.3 非功能测试

5.6 本章小结

结论

参考文献

攻读硕士学位期间发表的论文及其它成果

声明

致谢

展开▼

著录项

  • 作者

    秦月;

  • 作者单位

    哈尔滨工业大学;

  • 授予单位 哈尔滨工业大学;
  • 学科 计算机技术
  • 授予学位 硕士
  • 导师姓名 季振洲;
  • 年度 2019
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号