[发明专利]一种高效处理GPU片内和片间缓存一致性的数字电路设计方法有效
申请号: | 202110680159.2 | 申请日: | 2021-06-18 |
公开(公告)号: | CN113687955B | 公开(公告)日: | 2023-03-17 |
发明(设计)人: | 王俊 | 申请(专利权)人: | 上海天数智芯半导体有限公司 |
主分类号: | G06F9/54 | 分类号: | G06F9/54 |
代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 戴朝荣 |
地址: | 201114 上海市闵行*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 高效 处理 gpu 缓存 一致性 数字 电路设计 方法 | ||
1.一种高效处理GPU片内和片间缓存一致性的数字电路设计方法,其特征在于,包括:
步骤1:划分地址区域并增加代理二级缓存PGL2,实现GPU的缓存一致性具有可扩展性;
所述划分地址区域,具体为:
将整个GPU系统的二级公共缓存L2和设备内存都根据地址空间划成N个区域,一个区域一个L2缓存块;
一个区域的L2缓存块与该区域的设备内存地址空间对应,该L2缓存块定义为该区域设备内存地址空间的原始拥有者缓存;
原始拥有者缓存负责记录所有属于该区域设备内存地址空间的数据被缓存的缓存块状态,并负责最终将被缓存的缓存块写回该区域的设备内存;
所述增加PGL2,具体为:
设置代理二级缓存PGL2;
将PGL2分成若干份,每个区域都有一份PGL2;
一个区域内的PGL2不缓存属于本区域地址空间的数据,而只缓存非本区域地址空间的数据,其所共享的数据需与本区域L1缓存及非本区域的原始拥有者缓存通过设定的逻辑行为完成交互,来实现数据共享和同步;
设定的逻辑行为,包括:本区域L1缓存非占有状态在收到acquire请求发送GetV给L2缓存块时带上acquire指示进行拓展;
设定的逻辑行为,还包括:
对原本L2缓存块和设备内存的访问请求,根据请求地址是否属于本区域,将属于本区域的请求路由到本区域的原始拥有者缓存,而将非属于本区域的请求路由到PGL2;
PGL2与所有其他区域的原始拥有着有一个物理上的连接通路,连接通路基于具体系统架构实际情况而定;
对于存在片内划分的不同设备内存地址区域,PGL2和其他区域的原始拥有者通过新增的片内互联总线直接连接,对与GPU-GPU片间的不同区域,PGL2通过片间互联总线,路由到其他GPU上,再通过特定的连接通路连接到原始拥有者;
步骤2:当GPU规模增大或需要支持片间GPU互联或更多片间GPU互联时,同等增加区域和PGL2,实现缓存一致性。
2.根据权利要求1所述的一种高效处理GPU片内和片间缓存一致性的数字电路设计方法,其特征在于,每个或几个GPU内核设有独立的私有缓存,即L1缓存,每个独立L1缓存缓存属于任意设备内存地址空间的数据;
当存在GPU-GPU片间互联时,也包含缓存属于其他GPU设备内存的地址空间的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海天数智芯半导体有限公司,未经上海天数智芯半导体有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110680159.2/1.html,转载请声明来源钻瓜专利网。