[发明专利]一种GPU上的访存方法有效
申请号: | 201410419711.2 | 申请日: | 2014-08-25 |
公开(公告)号: | CN104199782B | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 吴明晖;裴玉龙;陈天洲;李颂元;孟静磊 | 申请(专利权)人: | 浙江大学城市学院 |
主分类号: | G06F12/02 | 分类号: | G06F12/02 |
代理公司: | 杭州求是专利事务所有限公司33200 | 代理人: | 林超 |
地址: | 310015 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种GPU上的访存方法。本发明对流处理器中发出的请求进行访存融合;流处理器将融合后的访存请求发送到相应内存中;内存中将融合后的访存请求进行拆分,并读出数据;内存中将读出数据形成数据块返回到流处理器;流处理器对发回的数据块进行处理、存储。本发明通过对访存地址具有相同间隔的访存请求进行融合,提高了访存效率,隐藏了内存延迟,提高了GPU的综合性能。可将本方法与现有方法结合使用,从而使得程序有一定程度的性能提升。 | ||
搜索关键词: | 一种 gpu 方法 | ||
【主权项】:
一种GPU上的访存方法,其特征在于:1)对流处理器中发出的请求进行访存融合;所述的步骤1)中对流处理器中发出的请求进行访存融合具体包括:1.1)将GPU多核中的流处理器发出的请求地址放在一个数组中;1.2)将数组中的访存地址按从小到大顺序进行排序,并使得同一数组中的各访存地址不重复;每个数组中,按从小到大的顺序依次将所有访存地址中访存地址之间的距离相同的访存地址融合为一次访存请求;2)流处理器将融合后的访存请求发送到相应内存中;3)内存中将融合后的访存请求进行拆分,并读出数据;4)内存中将读出数据形成数据块返回到流处理器;5)流处理器对发回的数据块进行处理、存储。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学城市学院,未经浙江大学城市学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410419711.2/,转载请声明来源钻瓜专利网。