[发明专利]图像分类和模型训练方法、装置、电子设备及存储介质有效
申请号: | 201910984564.6 | 申请日: | 2019-10-16 |
公开(公告)号: | CN110738261B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 王昊 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/40 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 邓海鸿;陈建民 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分类 模型 训练 方法 装置 电子设备 存储 介质 | ||
1.一种图像分类方法,其特征在于,包括:
将待分类图像的初级特征分别输入到图像分类模型的第一分支网络和第二分支网络,并利用所述第一分支网络识别所述待分类图像的细节特征,利用所述第二分支网络识别所述待分类图像的整体特征,其中,所述细节特征包括从所述待分类图像的局部范围内提取的局部元素的语义特征,所述第一分支网络包括L个第二卷积层、池化层和双线性层,所述第二分支网络包括K个第三卷积层和池化层,所述第二卷积层用于提取待分类图像的第一语义信息和位置信息,所述双线性层根据所述第一语义信息和所述位置信息得到所述待分类图像的细节特征,所述第三卷积层用于提取待分类图像的第二语义信息,所述第一分支网络和所述第二分支网络的池化层用于增大感受野,在所述第一分支网络和/或所述第二分支网络的池化层为最大值池化层,在所述第一分支网络和所述第二分支网络中的卷积层和池化层可间隔排列,所述第二卷积层的个数L小于所述第三卷积层的个数K,L和K为正整数;
根据所述细节特征与所述整体特征得到综合特征;
通过所述图像分类模型的全连接层将所述综合特征映射成类别向量;
对所述类别向量进行归一化处理,得到待分类图像的分类结果。
2.根据权利要求1所述的方法,其特征在于,所述整体特征包括利用所述待分类图像整体提取的语义特征。
3.根据权利要求1-2中任一项所述的方法,其特征在于,根据所述细节特征与所述整体特征得到综合特征,包括:
将所述细节特征与所述整体特征进行拼接,得到拼接后的综合特征。
4.一种图像分类模型训练方法,其特征在于,包括:
根据图像分类模型的第一分支网络提取的细节特征得到的分类结果,计算第一损失值,其中,所述细节特征包括从所述待分类图像的局部范围内提取的局部元素的语义特征;
根据所述图像分类模型的第二分支网络提取的整体特征得到的分类结果,计算第二损失值,所述第一分支网络包括L个第二卷积层、池化层和双线性层,所述第二分支网络包括K个第三卷积层和池化层,所述第二卷积层用于提取待分类图像的第一语义信息和位置信息,所述双线性层根据所述第一语义信息和所述位置信息得到所述待分类图像的细节特征,所述第三卷积层用于提取待分类图像的第二语义信息,所述第一分支网络和所述第二分支网络的池化层用于增大感受野,在所述第一分支网络和/或所述第二分支网络的池化层为最大值池化层,在所述第一分支网络和所述第二分支网络中的卷积层和池化层可间隔排列,所述第二卷积层的个数L小于所述第三卷积层的个数K,L和K为正整数;
通过图像分类模型的全连接层将综合特征映射成类别向量;
对类别向量进行归一化处理,得到待分类图像的分类结果;
根据所述待分类图像的分类结果,计算第三损失值;
将所述第一损失值、所述第二损失值和所述第三损失值加权求和,得到综合损失值;
利用所述综合损失值调节所述图像分类模型的网络参数。
5.一种图像分类装置,其特征在于,包括:
识别单元,用于将待分类图像的初级特征分别输入到图像分类模型的第一分支网络和第二分支网络,并利用所述第一分支网络识别所述待分类图像的细节特征,利用所述第二分支网络识别所述待分类图像的整体特征,其中,所述细节特征包括从所述待分类图像的局部范围内提取的局部元素的语义特征,所述第一分支网络包括L个第二卷积层、池化层和双线性层,所述第二分支网络包括K个第三卷积层和池化层,所述第二卷积层用于提取待分类图像的第一语义信息和位置信息,所述双线性层根据所述第一语义信息和所述位置信息得到所述待分类图像的细节特征,所述第三卷积层用于提取待分类图像的第二语义信息,所述第一分支网络和所述第二分支网络的池化层用于增大感受野,在第一分支网络和/或第二分支网络的池化层为最大值池化层,在所述第一分支网络和所述第二分支网络中的卷积层和池化层可间隔排列,所述第二卷积层的个数L小于所述第三卷积层的个数K,L和K为正整数;
拼接单元,用于根据细节特征与整体特征得到综合特征;
分类单元,用于通过所述图像分类模型的全连接层将所述综合特征映射成类别向量,对所述类别向量进行归一化处理,得到待分类图像的分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910984564.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种零售门店太空箱摆放检测方法、装置和设备
- 下一篇:文本识别方法和相关产品
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序