首页> 中文学位 >适用于多/众核系统的智能目录高速缓存
【6h】

适用于多/众核系统的智能目录高速缓存

代理获取

目录

声明

致谢

摘要

图表索引

1.绪论

1.1.片上共享存储系统发展现状

1.2.片上共享存储系统概述

1.2.1.目录一致性协议

1.2.2.高速缓存机制

1.3.片上共享存储系统研究现状

1.3.1.国外相关研究

1.3.2.国内相关研究

1.4.本文解决的关键问题

1.5.本文主要内容和工作安排

2.混合式目录条目尺寸压缩技术

2.1.全向量目录

2.2.混合目录

2.2.1.混合机制

2.2.2.组内混合

2.2.3.阵列混合

2.3.实验分析

2.3.1.组内混合目录分析

2.3.2.阵列混合目录分析

2.3.3.条目压缩技术对比

2.4.相关工作

2.5.本章小结

3.多粒度目录条目数量压缩技术

3.1.研究背景

3.1.1.块管理目录

3.1.2.数据访问模式和一致性免除技术

3.2.多粒度目录

3.2.1.基本多粒度目录

3.2.2.自适应机制

3.2.3.混合目录与多粒度目录协同设计

3.3.实验分析

3.3.1.区域条目设定范围探索

3.3.2.多粒度日录效果分析

3.3.3.目录压缩技术对比

3.3.4.多粒度混合目录效果分析

3.4.相关工作

3.5.本章小结

4.基于访问模式的元数据高速缓存优化

4.1.研究背景

4.2.元数据高速缓存机制

4.2.1.数据/元数据委托机制

4.2.2.组织结构

4.2.3.数据访问模式跟踪和委托策略

4.2.4.各类数据访问机制

4.2.5.对多核预取的优化

4.3.实验分析

4.3.1.委托机制效果分析

4.3.2.元数据高速缓存压缩

4.3.3.对多核预取的优化效果分析

4.4.相关工作

4.5.本章小结

总结与展望

参考文献

作者攻读博士学位期间发表的论文

作者攻读博士学位期间参与的科研工作

展开▼

摘要

集成电路技术的进步使得多个处理器核能够集成到单个芯片上,处理器核间的同步和通信成为提高多/众核系统性能的关键因素。共享存储模型是片上多处理器研究和应用中的一个热点问题,涉及到片上高速缓存资源的利用和一致性协议的实现。处理器核数的持续增长使得基于侦听的一致性协议面临性能和带宽的瓶颈。基于目录的一致性协议凭借其较好的可扩展性被广泛地采用,但面临硬件成本问题。目录高速缓存总的存储是目录条目尺寸和目录条目数量的乘积,其开销随着处理器核数的增加而迅速增长。本文针对共享存储片上多处理器系统,通过挖掘和利用数据访存模式,设计了表现力强、硬件开销小、灵活高效的片上存储子系统。表现力是指在目录高速缓存中跟踪和记录了数据的访存模式。本文主要解决了三个问题:1)目录条目尺寸的压缩,2)目录条目数量的压缩,3)分布式高速缓存和目录高速缓存的协调利用。
  首先,本文提出了一种混合结构的目录来减少目录条目的平均尺寸。传统目录缓存为每个条目分配了一个全向量来跟踪可能的共享者,其尺寸随着处理器核数成线性增长。本文从一个全新的、整体的角度来挖掘目录高速缓存的规律,根据其跟踪数据在访存模式上的差异性,提出了采用不同类型的条目来跟踪不同类型的数据;尤其利用了多线程应用程序中私有数据占据很大比例的特点,采用单指针和全向量相混合的方式来实现目录高速缓存。64路片上多核模拟器的仿真结果表明:混合目录中的单指针目录条目比例占到93.75%,相应的压缩比是2.7倍;系统执行时间、片上网络通信量和功耗开销的增长均在0.6%以下。而其他单条目压缩技术在实现1.7倍的压缩比时,至少要付出约2.5%的性能损失。
  其次,本文提出了多粒度目录来减少目录条目的数量。基本目录一致性协议是以单个高速缓存块为单位进行一致性维护的。连续地址空间内(区域)数据的访问模式存在一定的相关性,可以采用单个目录条目管理多个高速缓存块;同时为了避免单纯的区域化管理导致的虚假共享的增加,对区域内访问模式不同的数据还是以块为单位进行一致性维护。通过区域和块条目的结合使用,可以在减少目录条目数量的同时避免额外的一致性开销。设计中采用了两种粒度的区域条目,在条目类型上可以是私有或者共享的,区域条目的设定会随着相关性区域访问模式的变化而变化,来达到提高管理能力的目的。64路片上多核模拟器的仿真结果表明:多粒度目录可以将目录条目数量压缩10倍,同时其对性能的影响在0.5%左右。相关技术在实现同样的压缩比时性能下降了7.5%。而混合目录和多粒度目录相结合可以将目录缓存的存储开销压缩22倍,同时并行评测程序的平均执行时间只增长了0.3%。
  最后,本文结合细粒度的数据访问模式,提出了高效元数据高速缓存来提高片上存储子系统的效率,包括高速缓存机制和一致性维护两个方面。元数据包括了相关数据的一致性信息以及访问模式。根据元数据的内容,数据和元数据不再采用固定的私有或共享的映射机制,而是根据动态的访存行为迁移或复制到系统中的任意节点,从而加速数据访问和一致性维护的速度,同时可以降低片上网络中的通信量和功耗开销。64路片上多核模拟器的仿真结果表明:相比共享的高速缓存映射机制,采用我们的元数据高速缓存机制,系统执行时间可缩短10.5%,并且片上通信和存储系统功耗开销分别降低了34.7%和23.7%。这些性能提升都是在元数据存储压缩4.7倍的情况下获得的。作为片上多处理器的基本构件,有元数据高速缓存机制支持的多核预取技术可使系统执行时间进一步缩减5.1%。
  本论文探索多/众核系统的智能存储子系统的设计策略,达到了降低目录存储开销和规划调度节省的存储资源,以及优化存储管理的目的,提高了存储系统的一致性操作和网络通信效率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号