[发明专利]图像分类方法、装置、电子设备和存储介质在审
申请号: | 202110265357.2 | 申请日: | 2021-03-11 |
公开(公告)号: | CN115082930A | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 谢一宾;侯昊迪 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/18;G06V30/19;G06N3/08 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 彭绪坤 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分类 方法 装置 电子设备 存储 介质 | ||
1.一种图像分类方法,其特征在于,包括:
当检测到目标图像中对象部位缺失时,获取所述目标图像对应的目标文本;
对所述目标图像和所述目标文本进行特征提取,得到所述目标图像的图像特征和所述目标文本的文本特征;
对所述目标图像的图像特征和所述目标文本的文本特征进行特征融合,得到目标融合特征;
根据所述目标融合特征对所述目标图像的场景进行识别,得到场景信息;
基于所述场景信息确定所述目标图像的图像类别。
2.如权利要求1所述的图像分类方法,其特征在于,所述对所述目标图像和所述目标文本进行特征提取,得到所述目标图像的图像特征和所述目标文本的文本特征,包括:
在特征提取层对所述目标图像和所述目标文本进行特征提取;
所述特征提取层包括图像子网络和文本子网络,所述在特征提取层对所述目标图像和所述目标文本进行特征提取,包括:
采用训练好的图像子网络对所述目标图像进行图像特征提取,得到所述目标图像的图像特征;
采用训练好的文本子网络对所述目标文本进行文本特征提取,得到所述目标文本的文本特征。
3.如权利要求2所述的图像分类方法,其特征在于,所述在特征提取层对所述目标图像和所述目标文本进行特征提取之前,还包括:
获取预设模型,所述预设模型包括特征提取层、全连接层和输出层;
获取训练集,所述训练集包括训练图像和所述训练图像对应的训练文本;
基于所述训练图像训练所述预设的图像子网络,得到训练好的图像子网络;
基于所述训练文本训练所述预设的文本子网络,得到训练好的文本子网络;
采用所述训练好的图像子网络和所述训练好的文本子网络,对所述训练图像和所述训练文本进行特征提取,得到所述训练图像的图像特征和所述训练文本的文本特征;
基于所述训练图像的图像特征和所述训练文本的文本特征训练预设的全连接层和输出层,得到训练好的全连接层和输出层。
4.如权利要求2所述的图像分类方法,其特征在于,所述训练好的图像子网络包括浅层特征提取层、采样层、深层特征提取层和池化层,采用训练好的图像子网络对所述目标图像进行图像特征提取,得到所述目标图像的图像特征,包括:
采用所述浅层特征提取层对所述目标图像进行浅层特征提取,得到浅层特征;
采用所述采样层对所述浅层特征进行采样,得到采样特征;
采用所述深层特征提取层对所述采样特征进行深层特征提取,得到深层特征;
采用所述池化层对所述深层特征进行池化,得到所述目标图像的图像特征。
5.如权利要求4所述的图像分类方法,其特征在于,所述采用所述采样层对所述浅层特征进行采样,得到采样特征,包括:
在所述浅层特征上移动采样区域,得到移动后采样区域,其中,所述移动后采样区域与移动前采样区域部分相交;
对所述浅层特征上的移动后采样区域进行采样操作,得到采样特征。
6.如权利要求4所述的图像分类方法,其特征在于,所述深层特征提取层包括多个子特征提取层,所述采用所述深层特征提取层对所述采样特征进行深层特征提取,得到深层特征,包括:
将当前子特征提取层输出的特征矩阵与前一子特征提取层输出的特征矩阵进行特征融合,得到融合特征矩阵;
将所述融合特征矩阵输入下一子特征提取层进行深层特征提取;
获取最后端子特征提取层输出的特征矩阵,得到深层特征。
7.如权利要求6所述的图像分类方法,其特征在于,所述将当前子特征提取层输出的特征矩阵与前一子特征提取层输出的特征矩阵进行特征融合,包括:
当当前子特征提取层输出的特征矩阵与前一子特征提取层输出的特征矩阵的维度不一致时,基于当前子特征提取层中预设的卷积层,对当前子特征提取层输出的特征矩阵进行卷积操作,以增加当前子特征提取层输出的特征矩阵的维度;
对增加维度后的当前子特征提取层输出的特征矩阵与前一子特征提取层输出的特征矩阵进行求和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110265357.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动切换供电电路
- 下一篇:一种基于偏序关系的通用并发缺陷检测方法及系统
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序