[发明专利]对基于高性能串的循环加速器中的加载做控制推测的方法有效
申请号: | 201711205194.9 | 申请日: | 2017-11-27 |
公开(公告)号: | CN108241506B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | A.Y.奥斯塔内维奇;S.P.舍尔比宁;J.伊耶尔;D.M.马斯伦尼科夫;D.G.莫廷;A.V.埃尔莫洛维奇;A.楚德诺韦茨;S.A.罗兹科夫;B.A.巴巴彦 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 张凌苗;郑冀之 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 性能 循环 加速器 中的 加载 控制 推测 方法 | ||
本发明涉及一种对基于高性能串的循环加速器中的加载做控制推测的方法。一种装置包括二进制翻译器,用以将条件语句的分支中的加载指令提升超过条件语句并且在条件语句的补充分支中插入加载的推测控制(SCL)指令,其中SCL指令提供对在加载指令被提升之前的加载指令的真实程序顺序(RPO)的指示。装置进一步包括执行电路,用以执行加载指令以实行加载并且使得针对加载指令的条目被插入在排序缓冲器中,并且其中执行电路要执行SCL指令以使用由SCL指令提供的加载指令的RPO来定位排序缓冲器中的针对加载指令的条目并且从排序缓冲器丢弃针对加载指令的条目。
技术领域
本发明的实施例涉及计算领域;并且更具体地,涉及对基于串(strand)的循环加速器中的加载执行控制推测的领域。
背景技术
推测性执行是一种优化技术,其中计算机系统在知道一些任务是否将被需要之前提前执行所述任务,以便防止将由在已经知道需要所述任务之后执行该任务所招致的任何延迟。现代流水线化微处理器采用推测性执行来使用基于分支执行的历史行为而预测程序的执行路径的方案减小条件分支指令的成本。例如,可以将加载指令提升(hoist)超过包括条件语句(例如,If-语句或if-then-else语句)的一些在前指令,来隐藏存储器访问等待时间。通过将加载指令提升超过条件语句,在知道是否将需要加载之前执行与加载指令对应的加载。将加载指令提升超过条件语句的这样的技术被称为控制推测。
为了确保在采用控制推测时的恰当的程序执行,需要解决以下问题以便确保正确的程序执行:(1)牢记加载指令在提升之前的原始位置;(2)在执行推测性加载时,保持包括潜在异常的所有结果达一些时间;(3)在控制流经过加载的原始位置时向架构状态公开推测性加载的结果;以及(4)如果控制流没有经过加载的原始位置,则丢弃推测性加载的结果。
附图说明
通过参考以下描述和用来图示本发明的实施例的附图,可以最好地理解本发明。在各图中:
图1是图示根据一些实施例的处理器的示意图,所述处理器实现控制推测以使能基于高度并行的串的架构中的高水平的迭代间并行性;
图2是图示根据一些实施例的系统的示意图,所述系统实现控制推测以使能基于高度并行的串的架构中的高水平的迭代间并行性;
图3是图示根据一些实施例的排序缓冲器的示意图;
图4A是图示根据一些实施例的可以应用控制推测的示例性源代码的示意图;
图4B是图示根据一些实施例的针对在应用控制推测之前的在图4A中示出的源代码的示例性汇编代码的示意图;
图4C是图示根据一些实施例的针对在应用控制推测之后的在图4A中示出的源代码的示例性汇编代码的示意图;
图5是根据一些实施例的用以实现控制推测的过程的流程图,所述控制推测使能基于高度并行的串的架构中的高水平的迭代间并行性;
图6A-6B是图示根据本发明的实施例的通用向量友好指令格式及其指令模板的框图;
图6A是图示根据本发明的实施例的通用向量友好指令格式及其类别A指令模板的框图;
图6B是图示根据本发明的实施例的通用向量友好指令格式及其类别B指令模板的框图;
图7A是图示根据本发明的实施例的示例性特定向量友好指令格式的框图;
图7B是图示根据本发明的一个实施例的组成全操作码字段674的特定向量友好指令格式700的字段的框图;
图7C是图示根据本发明的一个实施例的组成寄存器索引字段644的特定向量友好指令格式700的字段的框图;
图7D是图示根据本发明的一个实施例的组成扩增操作字段650的特定向量友好指令格式700的字段的框图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711205194.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种页面适配方法及装置
- 下一篇:管理压缩加速器中的状态数据