[发明专利]一种应用于图形处理器的数据处理方法、装置及电子设备在审
申请号: | 202011465448.2 | 申请日: | 2020-12-14 |
公开(公告)号: | CN114626969A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 李英晗;顾震宇;王绍翾 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06T1/20 | 分类号: | G06T1/20;G06F17/16 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁;张艳梅 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 图形 处理器 数据处理 方法 装置 电子设备 | ||
1.一种应用于图形处理器(GPU)的数据处理方法,其特征在于,包括:
将待处理矩阵从目标GPU对应的内存中读入到目标流式多处理器中的寄存器,所述目标流式多处理器为用于对所述待处理矩阵进行矩阵计算的流式多处理器;
在将所述待处理矩阵从所述寄存器读入到所述寄存器对应的共享内存的过程中,对所述待处理矩阵执行第一预设操作,获得所述待处理矩阵对应的初始矩阵;
在将所述初始矩阵从所述共享内存读入到所述寄存器的过程中,对所述初始矩阵执行第二预设操作,获得符合矩阵乘法专用计算单元的矩阵乘法运算需求的目标矩阵,所述矩阵乘法专用计算单元为所述目标流式多处理器中专用于矩阵运算的计算单元。
2.根据权利要求1所述的应用于GPU的数据处理方法,其特征在于,所述将待处理矩阵从目标GPU对应的内存中读入到目标流式多处理器中的寄存器,包括:
获得所述寄存器的位数相对于所述待处理矩阵中元素对应的整数类型的位数的第一倍数;
根据所述第一倍数,从第一列开始依次将所述待处理矩阵中相同行的每所述第一倍数个的元素读入到所述寄存器。
3.根据权利要求2所述的应用于GPU的数据处理方法,其特征在于,所述获得所述寄存器的位数相对于所述待处理矩阵中元素对应的整数类型的位数的第一倍数,包括:
获得所述寄存器的位数;
获得所述待处理矩阵中元素对应的整数类型的位数;
根据所述寄存器的位数和所述待处理矩阵中元素对应的整数类型的位数,确定所述第一倍数。
4.根据权利要求1所述的应用于GPU的数据处理方法,其特征在于,所述对所述待处理矩阵执行第一预设操作,获得所述待处理矩阵对应的初始矩阵,包括:
获得针对所述待处理矩阵的第一读入指令,所述第一读入指令为针对第一整数类型的读入指令;
获得所述第一整数类型对应的位数相对于所述待处理矩阵中元素对应的整数类型的位数的第二倍数;
根据所述第二倍数,确定针对所述待处理矩阵的第一预设操作,所述第一预设操作为从第一行开始将矩阵中每所述第二倍数行的元素依次间隔分布合并为一行;
从第一行开始将所述待处理矩阵中每所述第二倍数行的元素依次间隔分布合并为一行,读入到所述共享内存,获得所述初始矩阵。
5.根据权利要求4所述的应用于GPU的数据处理方法,其特征在于,所述第二倍数为两倍;
所述从第一行开始将所述待处理矩阵中每所述第二倍数行的元素依次间隔分布合并为一行,读入到所述共享内存,获得所述初始矩阵,包括:从第一行开始将所述待处理矩阵中每两行的元素依次间隔分布合并为一行,读入到所述共享内存,获得所述初始矩阵。
6.根据权利要求5所述的应用于GPU的数据处理方法,其特征在于,所述第二倍数为二倍,包括:所述第一整数类型对应的位数为16位,所述待处理矩阵中元素对应的整数类型的位数为8位;
或者,所述第一整数类型对应的位数为32位,所述待处理矩阵中元素对应的整数类型的位数为16位。
7.根据权利要求4所述的应用于GPU的数据处理方法,其特征在于,所述第二倍数为一倍;
所述从第一行开始将所述待处理矩阵中每所述第二倍数行的元素依次间隔分布合并为一行,读入到所述共享内存,获得所述初始矩阵,包括:从第一行开始将所述待处理矩阵中每行的元素依次间隔分布合并为一行,读入到所述共享内存,获得所述初始矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011465448.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电动工具
- 下一篇:场景分类方法、装置、设备以及存储介质