[发明专利]并行处理设备和进行并行多值归约的方法有效
申请号: | 201880034679.2 | 申请日: | 2018-12-06 |
公开(公告)号: | CN111448545B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 埃里希·康拉德·埃尔森;桑德·艾蒂安·利亚·迪勒曼 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 肖华 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 并行 处理 设备 进行 多值归约 方法 | ||
1.一种包括多个并行处理单元的并行处理设备,其特征在于,所述并行处理设备被配置为执行使所述并行处理设备进行操作的指令,所述操作包括:
接收进行多值归约的请求,以从存储在所述多个并行处理单元的M个初始寄存器空间中的初始值计算M个最终归约值,其中,所述M个初始寄存器空间中的每一个都存储有N个初始值,所述N个初始值要归约成所述M个最终归约值的相应最终归约值;
由所述并行处理单元串行地进行多个初始部分归约,每个初始部分归约对所述M个初始寄存器空间中的不同的相应寄存器空间中的数据进行操作,其中,每个初始部分归约将存储有助于所述M个最终归约值的数据的寄存器的数量减半,并且在进行多个初始部分归约之后,存储有助于所述M个最终归约值的数据的寄存器的当前数量j小于或等于由所述并行处理单元并行执行的线程的数量N;
一个或多个并行处理单元中的每一个将由一个或多个初始部分归约计算出的相应值从一个寄存器移动到另一个寄存器,以便将从所述多个初始部分归约计算出的有助于所述M个最终归约值的所有值存储在相同第一寄存器空间中;以及
由所述并行处理单元对存储在所述第一寄存器空间中的值并行进行多个后续归约,以计算所述M个最终归约值,其中所述M个最终归约值中的每一个都是对存储在所述M个初始寄存器空间中的相应数据的相应归约,
串行地进行所述多个初始部分归约包括:由每个并行处理单元进行向下洗牌操作,之后进行向上洗牌操作,反之亦然。
2.如权利要求1所述的并行处理设备,其特征在于,所述并行处理设备为图形处理单元。
3.如权利要求1所述的并行处理设备,其特征在于,这些操作还包括将所述M个最终归约值中的一个或多个移动到相同并行处理单元的相应寄存器中。
4.如权利要求1所述的并行处理设备,其特征在于,每个初始部分归约包括一个或多个迭代,并且所述一个或多个迭代中的每个迭代将存储有助于所述M个最终归约值之一的数据的寄存器的数量减半。
5.如权利要求1所述的并行处理设备,其特征在于,移动由一个或多个初始部分归约计算的值包括将由每个相应的初始部分归约计算的有助于所述M个最终归约值之一的值移动到相同寄存器空间中的不同的相应寄存器分区中。
6.如权利要求5所述的并行处理设备,其特征在于,每个寄存器分区是相同寄存器空间中的寄存器的互斥子集。
7.一种由并行处理设备的多个并行处理单元进行并行M值归约的方法,其特征在于,所述方法包括:
接收进行多值归约的请求,以从存储在所述多个并行处理单元的M个初始寄存器空间中的初始值计算M个最终归约值,其中,所述M个初始寄存器空间中的每一个都存储有N个初始值,所述N个初始值要归约成所述M个最终归约值的相应最终归约值;
由所述并行处理单元串行地进行多个初始部分归约,每个初始部分归约对所述M个初始寄存器空间中的不同的相应寄存器空间中的数据进行操作,其中,每个初始部分归约将存储有助于所述M个最终归约值的数据的寄存器的数量减半,并且在进行多个初始部分归约之后,存储有助于所述M个最终归约值的数据的寄存器的当前数量j小于或等于由所述并行处理单元并行执行的线程的数量N;
一个或多个并行处理单元中的每一个将由一个或多个初始部分归约计算出的相应值从一个寄存器移动到另一个寄存器,以便将从所述多个初始部分归约计算出的有助于所述M个最终归约值的所有值存储在相同第一寄存器空间中;以及
由所述并行处理单元对存储在所述第一寄存器空间中的值并行进行多个后续归约,以计算所述M个最终归约值,其中所述M个最终归约值中的每一个都是对存储在所述M个初始寄存器空间中的相应数据的相应归约,
串行地进行所述多个初始部分归约包括:由每个并行处理单元进行向下洗牌操作,之后进行向上洗牌操作,反之亦然。
8.如权利要求7所述的方法,其特征在于,所述并行处理设备为图形处理单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880034679.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:采用纹理化表面的测定
- 下一篇:数据库同步