[发明专利]一种图像分类方法及装置在审
申请号: | 201610553942.1 | 申请日: | 2016-07-13 |
公开(公告)号: | CN107622272A | 公开(公告)日: | 2018-01-23 |
发明(设计)人: | 张亚森;石伟伟;龚怡宏 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙)11363 | 代理人: | 逯长明,许伟群 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 分类 方法 装置 | ||
技术领域
本发明涉及计算机视觉图像分类技术领域,特别是涉及一种图像分类方法及装置。
背景技术
近来,卷积神经网络在计算机视觉领域和模式识别的多个领域都获得了巨大的成功,例如在目标识别、目标检测、语义分割、目标追踪和图像检索等方面均取得了较好的效果。这些巨大的成功主要归功于以下两个方面的原因:一方面,以通用计算图形处理器(英文:General Purpose GPU,缩写:GPGPU)和CPU集群为代表的现在计算技术的快速发展允许研究人员训练较大规模和较高复杂度的神经网络;另一方面,拥有数以百万计标记图像的大规模数据集的出现,能够在一定程度上减少训练较大规模的卷积神经网络的过拟合,使得训练大规模网络成为可能。
通常地,对卷积神经网络图像分类的训练方法是单纯地采用基于随机梯度下降(缩写:SGD)的反向传播(英文Back Propagation,缩写:BP)算法。由于在这种训练方法中没有加入对卷积神经网络所学习到的特征的约束条件,所以导致训练出来的卷积神经网络图像分类系统分类精度不够好,表现为所学习到的特征的类内紧凑性和类间分离性不够好。
发明内容
本申请中提供了一种图像分类方法及装置,以提高图像分类精度,为了解决上述技术问题,本申请公开了如下技术方案:
第一方面,提供了一种图像分类方法,所述方法包括:
获取待分类图像的训练集;选择一个多层的卷积神经网络模型;对选取层做基于Min-Max准则的正则约束,并形成第二卷积神经网络模型,其中,所述选取层为所述卷积神经网络模型中的一层;使用所述训练集对所述第二卷积神经网络模型进行训练,并生成第三卷积神经网络模型;使用所述第三卷积神经网络模型对待分类图像的测试集进行分类。
本申请基于目标识别的不变性特征,所述不变性特征是指,当一个物体经过保同变换(例如位置平移,光照变化,形状变化、视角变化等等),其在特征空间里对应的特征向量也会随之变化,将特征向量投影到一个高维的特征空间里,由于高维特征空间的维数和特征向量的维数相同,所以这些所有保同变换在高维特征空间里对应的所有特征向量将会形成一个低维的流形,当属于同一类的目标流形变得比较紧凑,不同类目标物体的流形的间隔比较大时,就得到了较好的不变性特征。
本申请在对目标识别不变性特征的观察,提供了基于Min-Max准则改进的深度卷积神经网络图像的分流方法,通过对卷积神经网络的选取层特征做基于Min-Max准则的约束,使显式地强迫所学到的特征满足:属于同一类的目标流形有较好的类内紧凑性,属于不同类的目标流形有较大的类间间隔,进而能够显著地提高图像分类的精度。
此外,从选择的卷积神经网络模型中的选取层开始,对其进行Min-Max准则的正则约束运算,使得在训练大规模网络时,能够简化运算,避免通过增加网络规模和训练数据规模导致计算量大,效率低,同时也能够避免构建大规模的训练标注数据集时,投入耗费大量的时间、人力和财力。
结合第一方面,在第一方面第一种实现中,所述选择一个卷积神经网络模型包括:
获取一个mini-batch的训练样本;根据所述训练样本和目标函数,确定所述卷积神经网络模型;其中,所述训练样本表示为n表示所述mini-batch的大小,Xi表示原始的输入数据,ci表示Xi的类别标签,且ci∈{1,2,…,C},C表示所述训练集的类别总数;所述目标函数表示为:
W=(W(1),…,W(M);b(1),…,b(M)),W表示所述卷积神经网络模型的全部参数,表示训练样本的损失函数,M表示所述卷积神经网络模型的总层数,W(m)表示所述卷积神经网络模型第m层的权重参数,b(m)表示所述卷积神经网络模型第m层的偏置参数,m∈{1,2,…,M}中的任意一个值。
结合第一方面第一种实现,在第一方面第二种实现中,所述选择一个卷积神经网络模型之后还包括:对所述卷积神经网络模型划分层级;其中,所述划分层级后的卷积神经网络模型的每一层特征的递归表示为:
其中,Xi(m)表示所述卷积神经网络模型第m层的特征,*表示卷积运算,f(·)表示非线性激活函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610553942.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种家具加工用木材切割装置
- 下一篇:安装打磨轮的木板切割机
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序