[发明专利]一种基于GPU访存特性的异构多核架构缓存管理方法有效
申请号: | 201610567040.3 | 申请日: | 2016-07-19 |
公开(公告)号: | CN106250348B | 公开(公告)日: | 2019-02-12 |
发明(设计)人: | 方娟;郝晓婷;范清文;刘士建 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F15/167 | 分类号: | G06F15/167;G06F12/0806 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于GPU访存特性的异构多核架构缓存管理方法,首先进行消息的区分,对来自CPU和GPU核心L1 Cache的不同消息进行不同的处理;如果GPU L1 Cache请求的数据块在L2 Cache中,直接读取该数据块返回给GPU L1 Cache;如果请求的数据块不在L2 Cache中,但L2 Cache中有空闲,则从MEMORY中读取数据写入到L2 Cache中,并将数据返回给GPU L1 Cache;如果请求的数据块不在L2 Cache中,且L2 Cache中没有空闲,则直接发送请求消息给MEMORY,从MEMORY中读取消息,返回给GPU L1 Cache,并将该数据写入相应L1 Cache。本发明的方法减少了GPU应用程序所需数据在L2 Cache中的替换,将多余的空间留给CPU程序使用,提升了CPU应用程序的性能,从而提升异构多核系统的整体性能。 | ||
搜索关键词: | 一种 基于 gpu 特性 多核 架构 缓存 管理 方法 | ||
【主权项】:
1.一种基于GPU访存特性的异构多核架构缓存管理方法,其特征在于,异构多核架构由若干个CPU和GPU内核组成,所述CPU和GPU拥有各自的L1 Cache,共同访问L2 Cache,L1 Cache由L1 CacheController来控制,L2 Cache由L2 Cache Controller来控制,该方法包括如下步骤:步骤1、区分GPU核心和CPU核心的L1 Cache Controller;步骤2、跟踪消息传递过程,在每个消息上添加标志位来标记该消息的来源;步骤3、在L2 Cache Controller上进行消息类型判断,对来自GPU的L1 Cache请求做相应处理;其具体包含:步骤3.1、在L2 Cache的请求缓冲队列L1RequestToL2Cache中,识别不同消息,判断该消息标记位,如果是来自于GPU核心的L1 Cache Controller,首先判断L2中是否包含所请求的数据块,如果包含,直接根据消息类型执行相应的动作,将所需要的数据发送给请求者;步骤3.2、如果L2 Cache Controller中不包含该请求所需要的数据块,且L2 Cache中仍然有空间来存放数据,则触发响应事件去取得该数据存入L2Cache中,之后将该数据发送给L1请求者;步骤3.3、如果L2 Cache Controller中不包含该请求者所需要的数据,且没有多余空间来存放数据,则直接发送请求给MEMORY,请求获得相应的数据,消息传递过程中,将请求者赋值为原始消息请求者;步骤4、在Directory Controller中判断,如果是该消息请求者的类型为L1 Cache,则触发事件执行,赋其消息请求者为L1 Cache,读取内存数据;步骤5、在Directory Controller的内存消息响应队列中判断,如果消息原始请求者类型为L1 Cache,则触发相应事件,将该数据发送给L1 Cache Controller;步骤6、在L1 Cache Controller中接收到Directory Controller发回的数据时,将所述Directory Controller发回的数据块写入L1 Cache,并将数据发送给需要该数据的GPU核心;步骤7、当L1 Cache Controller进行替换或写回时,如果该数据块在L2 Cache中,直接替换,并进行数据状态及shares的改变,但如果不在L2 Cache中时,则将其发送给Directory Controller,进行数据替换及相应操作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610567040.3/,转载请声明来源钻瓜专利网。
- 上一篇:数据处理设备与互连器之间的基于硬件的一致性
- 下一篇:一种高能效异构计算系统