[发明专利]一种基于图像显著区域的图像分类方法和系统在审
申请号: | 201710167640.5 | 申请日: | 2017-03-20 |
公开(公告)号: | CN107016409A | 公开(公告)日: | 2017-08-04 |
发明(设计)人: | 程起敏;涂丛欢;张倩;涂明明;邵康 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06T7/136 |
代理公司: | 华中科技大学专利中心42201 | 代理人: | 李智,曹葆青 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 显著 区域 分类 方法 系统 | ||
技术领域
本发明属于图像内容分类及检索领域,更具体地,涉及一种基于图像显著区域的图像分类方法和系统。
背景技术
随着计算机与数字信息技术的不断发展,每天都有大量的数字图像通过各种渠道出现在人们的生活中。图像是对客观事物的一种相似性或者生动性的描述,是人类社会活动中最常用的信息载体,它作为人们最主要的信息来源,正在以各种各样的方式渗透到人们的工作、学习和生活中。在图像分类和检索等图像处理和分析的过程中,传统的方法大都会对图像的全图信息进行描述和分析,然而对图像的全图描述有时会包含干扰信息,比如针对包含显著区域的图像而言,图像的显著区域信息可以体现图像类别,而对背景信息的考虑会对图像分类和检索性能造成影响。
对于包含显著区域的图像而言,要想获取图像显著区域信息,往往需要定位或者分割提取出图像显著区域,目前提出的分割提取图像显著区域的方法可以分为两类:基于人工标注的交互式分割提取和基于图像显著性检测的自动分割提取。由于互联网图像数据量非常庞大,交互式分割方法耗时费力;而基于图像显著度的自动分割应用于背景较复杂的图像时,存在区域边界处划分准确率低或者误将目标区域划分成背景的局限。
图像分类是对互联网上庞大的图像资源进行组织、管理和检索的关键技术。目前图像分类大多基于全图实现,当图像语义类别相同但背景不同时,底层视觉特征一般不相似,针对这种图像训练图像分类器,分类性能会受背景信息的影响,从而使得图像分类准确率降低。而在不同拍摄条件下获取的图像,例如智能手机和平板电脑的图像,会出现底层视觉特征十分相似但语义类别明显不同的情况,仅仅基于底层视觉特征很难实现有效分类。因此针对包含显著区域的图像而言,图像类别往往由图像显著区域信息表现,基于原图进行图像类别判断会出现信息干扰,影响分类准确度。
发明内容
本发明针对上述现有技术的不足,提出一种基于图像显著区域的图像分类方法和系统,本发明的目的在于保证分割结果的前提下,减少人工交互的工作量,提高了图像分类的准确率。
为实现上述目的,按照本发明的一个方面,提供了一种基于图像显著区域的图像分类方法,包括离线训练和在线测试部分:
离线训练部分包括以下步骤:
S1:对图像进行N次超像素分割得到图像N层尺度下的分割块,计算图像的N层尺度下分割块的特征对比度得到N个显著图,融合N个显著图得到目标显著图;
S2:对目标显著图进行阈值分割得到二值图像,然后对该二值图像分别作形态学处理得到图像标记,然后基于图像标记利用分割算法对目标显著图进行自动分割提取得到显著区域;
S3:将显著区域作为训练样本输入到卷积神经网络中训练,得到基于图像显著区域的图像分类器;
在线测试部分包括以下步骤:
S4:测试图像按照步骤S1和S2的方式完成测试图像的显著区域自动分割提取,然后将测试图像的显著区域图像输入到离线训练好的图像分类器,图像分类器输出图像分类结果。
进一步的,S1中的特征对比度为色彩对比度、空间对比度和纹理对比度中的一种或几种。
更进一步的,S1中的特征对比度为色彩对比度和空间对比度。
进一步的,S2中阈值设定为W和H为目标显著图S的长和宽,(x,y)为目标显著图内像素点的坐标。
进一步的,S2中分割算法为GrowCut算法、GraphCut算法和GrabCut算法中的任意一种。
更进一步的,S2中分割算法为GrowCut算法。
进一步的,S3中卷积神经网络为AlexNet网络、LeNet网络、GoogLeNet网络、VGG网络和ResNet网络中的任意一种。
更进一步的,S3中卷积神经网络为AlexNet网络。
进一步的,S3中AlexNet网络通过来少量的权重衰减减小训练误差,其中权重更新规则为:
其中i是迭代次数,v是动力变量,ε是学习率,是对ωi求值的倒数在第i批样本Di上的平均值,ωi表示第i次迭代后的权重,ωi+1表示第i+1次迭代后的权重,vi表示第i次迭代后的动力变量,vi+1表示第i+1次迭代后的动力变量。
按照本发明的另一个方面,提供了一种基于图像显著区域的图像分类系统,包括离线训练模块和在线测试模块:
所述离线训练模块包括以下子模块:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710167640.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序