[发明专利]用于并行线程子集的一致加载处理无效
申请号: | 201310069394.1 | 申请日: | 2013-03-05 |
公开(公告)号: | CN103309702A | 公开(公告)日: | 2013-09-18 |
发明(设计)人: | 迈克尔·费特曼;斯图尔特·格伦·卡尔顿;道格拉斯·J·哈恩;拉杰史沃拉·塞尔瓦桑;瑟利斯·加德雷;史蒂文·詹姆斯·海因里希 | 申请(专利权)人: | 辉达公司 |
主分类号: | G06F9/445 | 分类号: | G06F9/445 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 徐丁峰;魏宁 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 并行 线程 子集 一致 加载 处理 | ||
1.一种用于从存储器检索与加载指令相关联的数据的方法,所述方法包括:
接收用于由线程组中的每个线程并行执行的第一加载指令,其中所述第一加载指令为所述线程组中的每个各自的线程指定单独存储器地址;
识别仅包括所述线程组中的所述线程的一部分的并行线程子集;
基于一致模式来比较包括第一存储器地址的、与包括在所述并行线程子集中的所述线程的所述一部分相关联的所述单独存储器地址以生成比较结果;
确定所述比较结果指示所述并行线程子集的所述单独存储器地址符合所述一致模式;以及
传送读请求到所述存储器以检索存储在所述第一存储器地址处的数据。
2.一种处理子系统,包括:
一致加载单元,其配置为:
接收用于由线程组中的每个线程并行执行的第一加载指令,其中所述第一加载指令为所述线程组中的每个各自的线程指定单独存储器地址;
识别仅包括所述线程组中的所述线程的一部分的并行线程子集;
基于一致模式来比较包括第一存储器地址的、与包括在所述并行线程子集中的所述线程的所述一部分相关联的所述单独存储器地址以生成比较结果;
确定所述比较结果指示与所述并行线程子集相关联的所述单独存储器地址符合所述一致模式;以及
加载/存储单元,其耦连在所述一致加载单元与存储器之间并配置为传送读请求到所述存储器以检索存储在所述第一存储器地址处的数据。
3.根据权利要求2所述的处理子系统,其中所述比较结果指示所述并行线程子集内的至少两个线程与所述第一存储器地址相关联。
4.根据权利要求2所述的处理子系统,其中所述比较结果指示所述并行线程子集内的至少两个线程与第二存储器地址相关联,并且所述读请求指定所述第一存储器地址和所述第二存储器地址。
5.根据权利要求2所述的处理子系统,其中所述一致加载单元配置为在识别所述并行线程子集之前,确定所述第一加载指令指定对于所述并行线程子集和所述线程组中的所述线程的附加并行线程子集,能够将所述第一加载指令作为一致加载指令加以处理的提示。
6.根据权利要求2所述的处理子系统,其中所述一致模式指定对与所述并行线程子集内的每对相邻线程相关联的单独存储器地址加以比较。
7.根据权利要求2所述的处理子系统,其中所述一致模式指定对与所述并行线程子集内的每对非相邻线程相关联的单独存储器地址加以比较。
8.根据权利要求2所述的处理子系统,其中所述一致加载单元进一步配置为:
接收用于所述线程组的、指示所述线程组中的线程应该执行所述第一加载指令的活动掩码;以及
使用所述活动掩码来生成所述比较结果。
9.一种计算系统,包括:
存储器,配置为存储用于线程组中的并行线程的数据;以及
处理子系统,包括:
一致加载单元,其配置为:
接收用于由线程组中的每个线程并行执行的第一加载指令,其中所述第一加载指令为所述线程组中的每个各自的线程指定单独存储器地址;
识别仅包括所述线程组中的所述线程的一部分的并行线程子集;
基于一致模式来比较包括第一存储器地址的、与包括在所述并行线程子集中的所述线程的所述一部分相关联的所述单独存储器地址以生成比较结果;
确定所述比较结果指示与所述并行线程子集相关联的所述单独存储器地址符合所述一致模式;以及
加载/存储单元,其耦连在所述一致加载单元与存储器之间并配置为传送读请求到所述存储器以检索存储在所述第一存储器地址处的数据。
10.根据权利要求9所述的计算系统,其中所述比较结果指示所述并行线程子集内的至少两个线程与所述第一存储器地址相关联。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辉达公司,未经辉达公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310069394.1/1.html,转载请声明来源钻瓜专利网。