[发明专利]用于优化GPU线程共享本地存储器访问的装置有效
申请号: | 201780035842.2 | 申请日: | 2017-05-03 |
公开(公告)号: | CN109313557B | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | J·雷;A·R·阿普;J·A·瓦莱里奥;B·纳拉希姆哈斯瓦米 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38;G06T1/20 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 张欣;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 优化 gpu 线程 共享 本地 存储器 访问 装置 | ||
1.一种图形处理器,包括:
第一逻辑,与第一执行单元耦合,所述第一逻辑用于接收来自所述第一执行单元的第一单指令多数据SIMD消息;
第二逻辑,与第二执行单元耦合,所述第二逻辑用于接收来自所述第二执行单元的第二单指令多数据SIMD消息;以及
第三逻辑,与共享本地存储器SLM的存储体耦合,所述第三逻辑用于接收来自所述第一逻辑的用于访问SLM的所述存储体的第一请求、来自所述第二逻辑的用于访问SLM的所述存储体的第二请求,并且用于在单个访问周期内针对所述第一请求将读取访问调度至读取端口以及针对所述第二请求将写入访问调度至写入端口。
2.如权利要求1所述的图形处理器,所述第三逻辑用于另外接收用于访问所述SLM的所述存储体的第三请求,其中,所述第三请求是对SLM的所述存储体的写入请求,所述第二请求是与在SLM的所述存储体处的前一原子操作相关联的回写请求,并且所述第三逻辑用于使所述第二请求优先于所述第三请求。
3.如权利要求2所述的图形处理器,其中,所述第三逻辑用于将所述第三请求维持为有效并且被配置用于在后续访问周期内处理所述第三请求。
4.如权利要求1-3中任一项所述的图形处理器,所述第三逻辑用于另外接收用于访问所述SLM的所述存储体的第三请求,其中,所述第三请求是来自所述第一逻辑的对SLM的所述存储体的写入请求,并且对所述写入端口的所述写入访问是针对所述第二请求和所述第三请求的组合写入。
5.如权利要求1所述的图形处理器,所述第三逻辑用于另外接收用于访问所述SLM的所述存储体的第三请求,其中,所述第三请求是来自所述第二逻辑的对SLM的所述存储体的读取请求,并且对所述读取端口的所述读取访问是针对所述第一请求和所述第三请求的组合读取。
6.如权利要求1所述的图形处理器,其中,所述第一请求来自所述第一执行单元上的第一线程,并且所述第二请求来自所述第二执行单元上的第二不同线程。
7.如权利要求6所述的图形处理器,其中,所述第一请求是来自所述第一线程的读取请求并且所述第二请求是来自所述第二不同线程的写入请求,所述读取请求被映射至SLM的所述存储体的第一端口并且所述写入请求被映射至SLM的所述存储体的第二端口。
8.如权利要求1所述的图形处理器,其中,所述第一逻辑用于检查所述SIMD消息内的每个槽并针对所述第一单指令多数据SIMD消息内的每个SLM访问请求确定相关联的SLM存储体,并且其中,所述第二逻辑用于检查所述SIMD消息内的每个槽并针对所述第二单指令多数据SIMD消息内的每个SLM访问请求确定相关联的SLM存储体。
9.如权利要求8所述的图形处理器,其中,所述第一逻辑用于检测所述第一单指令多数据SIMD消息内的存储体冲突并且所述第二逻辑用于检测所述第二单指令多数据SIMD消息内的存储体冲突,其中,用于访问SLM的所述存储体的第一端口的所述第一请求是在所述第一逻辑处所接收的一组冲突请求中的一个,并且用于访问SLM的所述存储体的第二端口的所述第二请求是在所述第二逻辑处所接收的一组冲突请求中的一个。
10.如权利要求1所述的图形处理器,另外包括所述第三逻辑的多个实例,其中,所述SLM的每个存储体与所述第三逻辑的实例耦合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780035842.2/1.html,转载请声明来源钻瓜专利网。