[发明专利]图像识别方法、装置、计算机设备和存储介质有效
| 申请号: | 202310851943.4 | 申请日: | 2023-07-12 |
| 公开(公告)号: | CN116597267B | 公开(公告)日: | 2023-09-29 |
| 发明(设计)人: | 王赟豪;余亭浩;陈少华 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/82;G06V10/42;G06V10/44 |
| 代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 杨欢 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 识别 方法 装置 计算机 设备 存储 介质 | ||
1.一种图像识别方法,其特征在于,所述方法包括:
对待识别的目标图像进行图像特征提取处理,得到原始特征图;
通过注意力机制对所述原始特征图进行局部特征激活处理,得到激活特征图;
对所述激活特征图进行自注意力机制处理,得到自注意力特征;
基于所述自注意力特征与所述原始特征图进行交叉注意力处理,得到交叉融合特征;
基于所述交叉融合特征进行图像识别处理,得到所述目标图像的图像识别结果。
2.根据权利要求1所述的方法,其特征在于,所述对待识别的目标图像进行图像特征提取处理,得到原始特征图包括:
对待识别的目标图像进行图块分割处理,得到分割图块;
对所述分割图块进行分层特征映射处理和移动窗口的注意力转换处理,得到原始特征图。
3.根据权利要求2所述的方法,其特征在于,对所述分割图块进行分层特征映射处理和移动窗口的注意力转换处理,得到原始特征图包括:
对所述分割图块进行逐步图块合并的下采样处理,得到分层的图块结构;
对所述分层的图块结构进行特征映射处理,得到分层特征映射结果;
基于所述分割图块进行移动窗口的注意力转换处理,得到注意力转换结果;
基于所述分层特征映射结果和所述注意力转换结果得到原始特征图。
4.根据权利要求1所述的方法,其特征在于,所述通过注意力机制对所述原始特征图进行局部特征激活处理,得到激活特征图包括:
通过注意力机制对所述原始特征图进行局部特征的显著性判别处理,生成所述原始特征图的注意力热力图;
将所述注意力热力图与所述原始特征图进行点乘处理,得到局部特征激活后的激活特征图。
5.根据权利要求1所述的方法,其特征在于,所述对所述激活特征图进行自注意力机制处理,得到自注意力特征包括:
对所述激活特征图进行矩阵变换处理,得到自注意力查询向量、自注意力键向量和自注意力值向量;
基于所述自注意力查询向量、所述自注意力键向量和所述自注意力值向量进行自注意力机制处理,得到自注意力特征。
6.根据权利要求1所述的方法,其特征在于,所述基于所述自注意力特征与所述原始特征图进行交叉注意力处理,得到交叉融合特征包括:
将所述自注意力特征确定为交叉注意力查询向量;
对所述原始特征图进行变换处理,得到交叉注意力键向量和交叉注意力值向量;
基于所述交叉注意力查询向量、所述交叉注意力键向量和交叉注意力值向量进行交叉注意力处理,得到交叉融合特征。
7.根据权利要求6所述的方法,其特征在于,所述对所述原始特征图进行变换处理,得到交叉注意力键向量和交叉注意力值向量包括:
对所述原始特征图进行压缩处理,得到压缩特征图;
对所述压缩特征图进行矩阵变换处理,得到交叉注意力键向量和交叉注意力值向量。
8.根据权利要求1所述的方法,其特征在于,所述基于所述交叉融合特征进行图像识别处理,得到所述目标图像的图像识别结果包括:
对所述交叉融合特征进行池化处理,得到图像特征序列;
基于所述图像特征序列在特征数据库进行特征检索,得到特征检索结果;
基于所述特征检索结果确定所述目标图像的图像识别结果。
9.根据权利要求1所述的方法,其特征在于,所述基于所述交叉融合特征进行图像识别处理,得到所述目标图像的图像识别结果包括:
对所述交叉融合特征进行池化处理,得到图像特征序列;
添加分类头至所述图像特征序列,构建图像分类特征;
对所述图像分类特征进行多标签分类处理,得到所述目标图像的图像识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310851943.4/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





