首页> 中文学位 >面向RISC处理器的发射队列中的唤醒逻辑和更新逻辑的设计
【6h】

面向RISC处理器的发射队列中的唤醒逻辑和更新逻辑的设计

代理获取

目录

声明

摘要

第一章 绪论

1.1 课题背景与意义

1.2 国内外研究现状

1.3 研究内容与设计指标

1.3.1 研究内容

1.3.2 设计指标

1.4 论文组织

第二章 动态流水线与多发射数据通路

2.1 CPU性能的测量

2.2 动态流水线

2.2.1 影响流水线效率的因素

2.2.2 指令调度技术

2.2.3 动态调度

2.2.4 动态流水线的例外处理

2.3 多发射数据通路

2.3.1 指令级并行技术

2.3.2 发射队列的组织形式

2.3.3 发射队列和寄存器的位置关系

2.3.4 重命名寄存器的存在形式

2.3.5 乱序执行处理器的流水线通路

2.3.6 处理器的多发射结构

2.4 本章小结

第三章 发射队列系统设计与性能优化

3.1 发射队列的系统级设计

3.1.1 基于非压缩的发射队列的系统级实现

3.1.2 基于压缩的发射队列的系统级实现

3.2 面向ARM v7的发射队列的性能优化

3.2.1 发射队列整体架构设计

3.2.2 动态FIFO的功能支持

3.2.3 更新逻辑的功能支持

3.2.4 唤醒逻辑的功能支持

3.2.5 针对ARM v7的发射队列的优化

3.3 本章小结

第四章 面向ARM v7的发射队列模块的设计

4.1 动态FIFO模块设计

4.1.1 反馈模块

4.1.2 存储模块

4.1.3 输出产生模块

4.2 发射队列模块架构

4.3 更新逻辑模块设计

4.3.1 指令有效性更新模块

4.3.2 执行条件判决更正模块

4.3.3 队列有效项计数模块

4.3.4 偏移位置产生模块

4.3.5 队列更新模块

4.4 唤醒逻辑模块设计

4.4.1 指令源操作数状态更新模块

4.4.2 发射指令选择模块

4.4.3 指令无效性更新模块

4.5 本章小结

第五章 验证及结果分析

5.1 功能仿真验证

5.1.1 验证环境与测试模型

5.1.2 模块级功能验证及结果分析

5.2 逻辑综合验证

5.2.1 配置逻辑综合环境

5.2.2 设计代码的读入和时序约束的添加

5.2.3 逻辑综合与结果分析

5.3 FPGA验证可行性

5.4 本章小结

第六章 总结与展望

6.1 总结

6.2 展望

参考文献

致谢

攻读硕士学位期间发表的论文

展开▼

摘要

受益于半导体工艺的快速发展和处理器体系结构的稳步推进,微处理器获得了更快的时钟频率和更强的处理能力。更快的时钟频率一方面来自于更先进的半导体制程,另一方面来自于流水线的进一步细化。处理能力的提升离不开各种并行技术,包括数据级并行、指令级并行和线程级并行。指令级并行包括流水线技术、多发射技术和乱序执行技术。流水线技术使指令的执行时间重叠。多发射技术使指令的执行空间重叠。乱序执行技术充分利用处理器资源,挖掘指令间的可重叠性和不相关性,其主要包括动态调度技术、转移猜测技术和非堵塞访存技术。
  本文提出面向ARM v7指令集的指令乱序调度模块。该乱序调度逻辑实现了普通乱序调度逻辑的指令调度功能,并针对ARM v7指令集中指令的条件执行特性进行了优化。ARM v7指令编码中含有决定某条指令是否可以被执行的条件编码字段,某条指令是否能够被执行取决于执行该指令时的系统状值是否满足该指令条件码字段的要求。虽然ARM v7的这个特性从压缩程序最终编译生成的代码量上来讲具有积极作用,但是这加重了指令间的相关性。指令间的相关性强不利于指令调度,影响了处理器并行执行指令的性能。针对这个问题,本文设计的乱序调度模块实现了通过猜测系统状态值从而进行推测执行指令的机制。从提高处理器的指令级并行性为切入点进行创新设计,进而提高处理器的性能。该模块通过用System Verilog进行寄存器传输级建模和验证,采用台积电的65nm工艺库进行逻辑综合,实验结果表明本文提出的方案基本满足设计的需要,达到预期的效果。
  本文提出的方法针对采用ARM v7指令集的处理器进行了性能的优化,而ARM v7指令集是目前ARM Cortex-A9、Cortex-A7和Cortex-A15采用的指令集,在移动终端的微处理器市场占有主导地位,因此该方法有一定的工程实用价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号