首页> 中文学位 >面向非易失性内存的末级高速缓存替换算法研究
【6h】

面向非易失性内存的末级高速缓存替换算法研究

代理获取

目录

Cover

声明

摘 要

ABSTRACT

目 录

插图目录

表格目录

1 绪论

1.1 问题的提出

1.1.1 选题背景

1.1.2 研究动机

1.2 国内外研究现状

1.2.1 研究现状

1.2.2 现状评述

1.3 研究内容

1.4 全文组织结构

2 面向非易失性内存的末级高速缓存替换算法的问题分析

2.1 高速缓存替换算法的工作原理

2.2 非易失性内存对缓存替换算法的挑战

2.2.1 技术挑战

2.2.2 研究现状评述

2.3 面向非易失性内存的访存行为剖析

2.3.1 读写性能分析

2.3.2 读写请求分布比例

2.3.3 面向写优化的算法

2.4 本章小结

3 面向非易失性内存的末级高速缓存替换算法设计

3.1 基于时延的统一重用优先级模型

3.1.1 概述

3.1.2 替换模型的形式化定义

3.1.3 基于时延的统一重用优先级

3.2 替换算法的总体设计

3.2.1 设计思想

3.2.2 功能模块

3.3 基于动态采样的的读写区段划分机制

3.3.1 概述

3.3.2 基于动态采样的读写区段划分预测

3.3.3 访存类型感知的读写区段动态调整

3.4 基于热度和重用的写分类预测算法

3.4.1 概述

3.4.2 基于热度的写分类预测算法

3.4.3 基于写后重用的写分类预测算法

3.5 本章小结

4 面向非易失性内存的末级高速缓存替换算法的评测分析

4.1 实验环境准备

4.1.1 模拟器参数配置

4.1.2 测试程序描述

4.1.3 评测方法

4.2 微基准程序评测

4.2.1 系统整体的性能

4.2.2 内存系统的流量

4.2.3 内存系统的能耗

4.3 图计算应用评测

4.3.1 系统整体的性能

4.3.2 内存系统的流量

4.3.3 内存系统的能耗

4.4 系统开销分析

4.5 本章小结

5 全文总结和展望

5.1 全文工作总结

5.2 未来研究展望

致 谢

参考文献

展开▼

摘要

随着云计算和大数据技术的发展演化,现代数据中心对数据的存储和计算提出了新的需求,内存计算技术成为大数据时代的重要技术手段。由于功耗和存储密度的限制,传统的基于动态随机存取技术(DRAM)的内存系统面临着扩展性瓶颈。以非易失性内存(NVM)为代表的新型内存技术,因其高存储密度和较低的静态功耗,为突破内存系统的扩展性瓶颈提供了新的契机。 然而,NVM的写操作的延时和功耗要远远高于读操作。写操作的低效性在形成写关键路径的同时也放大了写后读的时延,从而给内存子系统设计带来了严峻的挑战。传统的面向DRAM的末级高速缓存(LLC)替换算法,专注于提升缓存命中率,没有考虑读写操作的不对称性,无法适应基于NVM的内存系统的技术特点。 面向NVM的LLC替换算法研究,提出了基于时延的统一重用优先级URP模型,将提升缓存命中和减少写回流量作为统一的优化目标。基于URP模型,设计了面向写回的读写区段划分机制,提供了一种逻辑上的读写数据块分割机制,能够同时保障LLC的命中率和对NVM的写回流量,通过使用基于动态采样的分区预测器估算当前时间窗口内最佳的读写区段容量,支持访存类型感知的分区动态调整;设计了基于热度和写后重用的写分类预测算法,从写访问的频度及数据块的写后重用率两个维度进一步对写操作请求做了细粒度的区分,通过提升频繁写和写后重用度高的数据块的统一重用价值,降低了这类高价值数据块被替换的概率。 在基于时钟周期准确的微体系结构模拟器上实现了URP算法,基于访存密集型的微基准测试程序SPEC CPU2006和真实的图计算应用GraphBIG的评测分析表明,对于SPEC CPU2006,URP算法能平均改善性能约17.2%,对内存的读写流量分别降低约24.3%和43.5%,改善功耗约25.3%;对GraphBIG,URP算法能平均改善性能约12.3%,对内存的读写流量分别降低约14.6%和11.5%,改善功耗约3.9%。与同类的其他算法相比,基于全局时延优化目标的URP算法能以微弱的系统开销,有效地降低对内存系统的读写访问流量,改善系统功耗,提升系统整体性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号