[发明专利]基于GEMM处理图像数据的方法、装置、设备和介质有效
申请号: | 202011016965.1 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112184536B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 韩洁 | 申请(专利权)人: | 成都海光集成电路设计有限公司 |
主分类号: | G06T1/20 | 分类号: | G06T1/20;G06T1/60 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 王娟 |
地址: | 610041 四川省成都市高新区天府大道*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 gemm 处理 图像 数据 方法 装置 设备 介质 | ||
本公开提供了一种基于GEMM处理图像数据的方法、装置、设备和介质。所述方法包括:获取汇编指令集,所述汇编指令集指定针对图像数据的预定操作序列;对所述汇编指令集进行分析,得到指令集分析结果;根据所述指令集分析结果分配用于执行所述预定操作序列的寄存器;读取所述图像数据,并利用所分配的寄存器对所述图像数据执行所述预定操作序列。本公开提供的方法由于不是通常所采用的在处理图像数据的同时分配寄存器,而是在对指定针对图像数据的预定操作序列的汇编指令集分析之后统一分配寄存器,从而提高了GPU对图像数据的处理速度,并且合理利用了存储资源。
技术领域
本公开涉及图像处理技术,更具体地,涉及基于通用矩阵乘法GEMM处理图像数据的方法、装置、设备和介质。
背景技术
图形处理器(GPU)主要用于对图形或图像数据进行处理,其中通用矩阵乘法(General Matrix to Matrix Multiplication,GEMM)是GPU编程中最重要的模块,而目前的GEMM模块在对图像数据进行处理时,是在处理图像数据的同时分配寄存器,这将存在重复分配寄存器和频繁释放寄存器等问题,进而导致GPU对图像数据的处理速度慢、占用不必要的存储资源。
因此,需要一种提高GPU对图像数据的处理速度,并且合理利用存储资源的方法。
发明内容
本公开的实施例提供了一种基于通用矩阵乘法GEMM处理图像数据的方法,包括:获取汇编指令集,所述汇编指令集指定针对图像数据的预定操作序列;对所述汇编指令集进行分析,得到指令集分析结果;根据所述指令集分析结果分配用于执行所述预定操作序列的寄存器;以及读取所述图像数据,并利用所分配的寄存器对所述图像数据执行所述预定操作序列。
根据本公开的实施例,所述汇编指令集包括自定义的汇编指令,所述自定义的汇编指令位于所述预定操作序列的每一操作的起始位置。
根据本公开的实施例,所述自定义的汇编指令包括汇编字符串和操作数约束条件。
根据本公开的实施例,对所述汇编指令集进行分析包括:解析所述汇编字符串中的操作符和操作数并解析与操作数对应的操作数约束条件,以确定寄存器分配方式。
根据本公开的实施例,根据所述指令集分析结果分配用于执行所述预定操作序列的寄存器包括:在汇编字符串中的操作符的类型是标签的情况下,不为该操作符分配寄存器;在操作数约束条件中包括预定义的寄存器ID和保留关键字的情况下,按照预定义的寄存器ID为保留关键字分配所需数量的寄存器;在汇编字符串中的操作数是非数字的情况下,从已注册的寄存器列表中查找寄存器ID;在汇编字符串中的操作数是数字的情况下,检查操作数的地址,在已注册的寄存器列表里查找与所述地址对应的寄存器ID,如果通过查找确定该地址已被注册,则不为该操作数分配新的寄存器,否则,按照操作数所需寄存器个数分配相应的寄存器。
根据本公开的实施例,利用所分配的寄存器对所述图像数据执行所述预定操作序列包括:将图像数据的第一矩阵块和第二矩阵块加载到内存中;将加载到内存中的所述图像数据的第一矩阵块和第二矩阵块存储到缓存中;对存储到缓存中的所述图像数据的第一矩阵块和第二矩阵块进行逻辑运算操作;将通过逻辑运算操作获得的结果矩阵存回内存中。
本公开的实施例提供了一种基于通用矩阵乘法GEMM处理图像数据的装置,包括:获取模块,被配置为获取汇编指令集,所述汇编指令集指定针对图像数据的预定操作序列;分析模块,被配置为对所述汇编指令集进行分析,得到指令集分析结果;分配模块,被配置为根据所述指令集分析结果分配用于执行所述预定操作序列的寄存器;以及执行模块,被配置为读取所述图像数据,并利用所分配的寄存器对所述图像数据执行所述预定操作序列。
根据本公开的实施例,所述汇编指令集包括自定义的汇编指令,所述自定义的汇编指令位于所述预定操作序列的每一操作的起始位置。
根据本公开的实施例,所述自定义的汇编指令包括汇编字符串和操作数约束条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都海光集成电路设计有限公司,未经成都海光集成电路设计有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011016965.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序