首页> 中文学位 >高性能稠密线性代数数学库关键技术研究
【6h】

高性能稠密线性代数数学库关键技术研究

代理获取

目录

声明

符号使用说明

第一章 绪论

1.1 研究背景与意义

1.1.1 数值线性代数的内涵

1.1.2 线性代数数学库发展历程

1.1.3 研究现状与不足

1.2 论文主要工作

1.3 论文组织结构

第二章 相关研究工作

2.1 BLAS开发与优化

2.1.1 GEMM分块算法

2.1.2 kernel函数生成与优化

2.1.3 GEMM访存优化

2.1.4 GEMM并行优化

2.2 高层线性代数库

2.3 小结

第三章 可移植的kernel函数自动生成与编译优化方法

3.1 引言

3.2 设计与实现

3.2.1 kernel自动生成

3.2.2 kernel优化技术

3.3 性能分析

3.3.1 μkernel性能

3.3.2 GEMM性能

3.3.3 定量分析

3.4 小结

第四章 并行环境下非LRU共享cache的划分方法

4.1 引言

4.2 背景

4.2.1 存储层次结构回顾

4.2.2 GEMM的线程间数据冲突

4.3 设计与实现

4.3.1 SCP实例

4.3.2 算法描述

4.4 性能分析

4.4.1 线程间cache数据冲突对GEMM性能的影响

4.4.2 SCP方法的有效性

4.4.3 cache缺失率分析

4.4.4 共享矩阵B2的私有化

4.5 小结

第五章 混合粒度动态负载均衡算法

5.1 引言

5.2 背景

5.3 设计与实现

5.3.1 混合任务粒度

5.3.2 低开销任务管理机制

5.3.3 基于数据局部性的负载窃取优化

5.4 性能分析

5.4.1 实验环境

5.4.2 测试结果

5.4.3 定量分析

5.4.4 任务粒度调优

5.5 小结

第六章 总结与展望

6.1 工作总结

6.2 研究展望

致谢

参考文献

作者在学期间取得的学术成果

展开▼

著录项

  • 作者

    苏醒;

  • 作者单位

    国防科学技术大学国防科技大学;

  • 授予单位 国防科学技术大学国防科技大学;
  • 学科 软件工程
  • 授予学位 博士
  • 导师姓名 廖湘科;
  • 年度 2020
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 TP3TN9;
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号