首页> 中文学位 >NUMA架构下多线程访存分析系统与实现
【6h】

NUMA架构下多线程访存分析系统与实现

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

1绪论

1.1背景及目的

1.2国内外研究现状

1.3主要研究内容

1.4文章框架结构

2多线程访存分析机制

2.1多线程访存问题

2.2多线程访存分析方法

2.3多线程访存衡量指标

2.4多线程访存优化方法

2.5小结

3多线程访存分析系统实现

3.1系统功能模块与流程

3.2相关信息采集

3.3关键变量分析

3.4小结

4系统测试与结果分析

4.1 Blackscholes程序测试

4.2 Streamcluster程序测试

4.3 LU程序测试

4.4小结

5总结与展望

致谢

参考文献

附录1 攻读硕士学位期间发表论文目录

附录2 攻读硕士学位期间申请的国家发明专利

附录3 攻读硕士学位期间参与的项目

展开▼

摘要

非一致性内存访问(NUMA, Non-Uniform Memory Architecture)架构是目前主流的高性能服务器架构之一。NUMA架构的主要特点是访存延迟的不一致性,即处理器访问本地内存所需时间比访问远程内存少。从处理器到其本地内存的访问不仅更快,而且能减少造成节点间互联链路和各节点内存控制器拥塞的可能性。在NUMA架构下运行多线程程序时,如果没有很好地将多线程程序的线程和数据协同存放,该多线程程序可能经历相当大的访存延迟。因此,提出 NUMA架构下的多线程访存分析机制对提升程序性能具有重要的意义。
  新的机制以多线程程序中各个变量作为研究对象,采用变量平均访存延迟作为识别NUMA问题的指标。若判断出可能存在NUMA问题,则通过变量平均访存延迟以及变量访问比例找出受 NUMA架构造成的问题影响最严重的变量,根据应用程序中对于该变量的线程访问模式来了解并解决问题。基于该机制的多线程访存分析系统首先采用硬件采样机制对程序运行时执行的访存指令进行采样,包括指令的发起线程、目的变量以及所花费的时钟周期等信息;其次,据此计算程序中所有变量的平均访存延迟并排序,依据访问比例找出最具优化价值的变量;最后,总结出多线程对该变量的访问规律,从而协助用户提出针对该变量的具体优化方法。这种以数据变量为中心的分析机制,不仅能较精准地探测到 NUMA架构下程序中的访存延迟问题,而且能够针对变量解析多线程程序对其的访问模式,从而准确地找到解决该问题的优化方案。
  测试结果表明,对于NUMA架构下运行的多线程程序,该机制能够识别出各种NUMA架构造成的访存问题,并能够检测到多个线程访问数据的各种不同模式,通过相应的优化手段,能够取得高达51.92%的性能优化。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号