[发明专利]用于页面-局部基于增量的预取器的方法和装置在审
申请号: | 202180045404.0 | 申请日: | 2021-03-01 |
公开(公告)号: | CN115715391A | 公开(公告)日: | 2023-02-24 |
发明(设计)人: | 真下进;约翰·卡拉马丁纳斯 | 申请(专利权)人: | 超威半导体公司 |
主分类号: | G06F12/0862 | 分类号: | G06F12/0862 |
代理公司: | 上海胜康律师事务所 31263 | 代理人: | 李献忠;张华 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 页面 局部 基于 增量 预取器 方法 装置 | ||
本发明公开了一种方法,该方法包括:记录第一组连续存储器访问增量,其中这些连续存储器访问增量中的每个连续存储器访问增量表示由应用程序访问的两个存储器地址之间的差;基于该第一组存储器访问增量来更新预取训练表中的值;以及响应于第二组连续存储器访问增量并且基于该预取训练表中的值来预测用于预取的一个或多个存储器地址。
相关申请
本申请要求2020年6月26日提交的美国临时申请第63/044,468号的优先权,该申请全文以引用方式并入本文。
本发明是在政府的支持下基于具有由DOE授予的劳伦斯利弗莫尔国家安全的PathForward项目(基本合同No.DE-AC52-07NA27344,分包合同No.B620717)完成的。政府享有本发明的某些权利。
背景技术
现代计算系统中的处理器通常可比存储处理器所使用的指令或其他数据的主存储器快得多地操作。因此,在许多情况下,将更小且更快的高速缓存存储器与主存储器结合使用以提供对指令或数据的快速访问。当处理器在实际需要数据之前请求将数据存储在高速缓存中时,发生将数据预取到高速缓存。然后,当需要数据时,可从高速缓存中检索该数据,而不会招致从主存储器请求该数据而引起的附加延迟。
由于大多数程序是按顺序执行的或者表现出其他规则的执行模式,因此可按程序顺序或者根据存储器访问流中的其他识别模式来获取指令或其他数据。然而,预取了不正确的数据或在不适当的时间预取数据可减少通过预取具体实施提供的总体益处。
附图说明
在附图的各图中以示例而非限制的方式示出了本公开。
图1示出了根据实施方案的计算系统。
图2示出了根据实施方案的计算系统中的存储器分级结构。
图3示出了根据实施方案的基于增量(delta)的预取器的部件。
图4A示出了根据实施方案的在基于增量的预取器的训练过程中使用的数据结构。
图4B示出了根据实施方案的用于训练基于增量的预取器的过程。
图5A示出了根据实施方案的在基于增量的预取器的预取预测过程中使用的数据结构。
图5B示出了根据实施方案的由基于增量的预取器执行的预取预测过程。
图6A示出了根据实施方案的在基于增量的预取器的训练过程中使用的数据结构。
图6B示出了根据实施方案的用于训练基于增量的预取器的过程。
图6C示出了根据实施方案的相关性权重表中的递增权重。
图7A示出了根据实施方案的在基于增量的预取器的预取预测过程中使用的数据结构。
图7B示出了根据实施方案的由基于增量的预取器执行的预取预测过程。
具体实施方式
以下描述阐述了众多具体细节诸如特定系统、部件、方法等的示例,以便提供对实施方案的良好理解。然而,对于本领域技术人员将显而易见的是,可在没有这些具体细节的情况下实践至少一些实施方案。在其他情况下,未详细描述众所周知的部件或方法,或者以简单的框图格式呈现众所周知的部件或方法,以便避免不必要地混淆实施方案。因此,所阐述的具体细节仅是示例性的。特定具体实施可因这些示例性细节而异,并且仍设想在实施方案的范围内。
存储器延迟难以降低,并因此表示对计算机系统性能的缩放的显著阻碍。数据预取通过推测性地发出存储器请求使得数据在被使用之前移动到更快的高速缓存存储器来隐藏存储器延迟。然而,不准确的预取可能导致计算资源被低效地消耗,同时仍然无法隐藏针对实际使用的数据的存储器延迟。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于超威半导体公司,未经超威半导体公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180045404.0/2.html,转载请声明来源钻瓜专利网。