[发明专利]一种基于图像显著区域的图像分类方法和系统在审

申请号：	201710167640.5	申请日：	2017-03-20
公开（公告）号：	CN107016409A	公开（公告）日：	2017-08-04
发明（设计）人：	程起敏;涂丛欢;张倩;涂明明;邵康	申请（专利权）人：	华中科技大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06K9/46;G06T7/136
代理公司：	华中科技大学专利中心42201	代理人：	李智,曹葆青
地址：	430074 湖北***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于图像显著区域分类方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于图像内容分类及检索领域，更具体地，涉及一种基于图像显著区域的图像分类方法和系统。

背景技术

随着计算机与数字信息技术的不断发展，每天都有大量的数字图像通过各种渠道出现在人们的生活中。图像是对客观事物的一种相似性或者生动性的描述，是人类社会活动中最常用的信息载体，它作为人们最主要的信息来源，正在以各种各样的方式渗透到人们的工作、学习和生活中。在图像分类和检索等图像处理和分析的过程中，传统的方法大都会对图像的全图信息进行描述和分析，然而对图像的全图描述有时会包含干扰信息，比如针对包含显著区域的图像而言，图像的显著区域信息可以体现图像类别，而对背景信息的考虑会对图像分类和检索性能造成影响。

对于包含显著区域的图像而言，要想获取图像显著区域信息，往往需要定位或者分割提取出图像显著区域，目前提出的分割提取图像显著区域的方法可以分为两类：基于人工标注的交互式分割提取和基于图像显著性检测的自动分割提取。由于互联网图像数据量非常庞大，交互式分割方法耗时费力；而基于图像显著度的自动分割应用于背景较复杂的图像时，存在区域边界处划分准确率低或者误将目标区域划分成背景的局限。

图像分类是对互联网上庞大的图像资源进行组织、管理和检索的关键技术。目前图像分类大多基于全图实现，当图像语义类别相同但背景不同时，底层视觉特征一般不相似，针对这种图像训练图像分类器，分类性能会受背景信息的影响，从而使得图像分类准确率降低。而在不同拍摄条件下获取的图像，例如智能手机和平板电脑的图像，会出现底层视觉特征十分相似但语义类别明显不同的情况，仅仅基于底层视觉特征很难实现有效分类。因此针对包含显著区域的图像而言，图像类别往往由图像显著区域信息表现，基于原图进行图像类别判断会出现信息干扰，影响分类准确度。

发明内容

本发明针对上述现有技术的不足，提出一种基于图像显著区域的图像分类方法和系统，本发明的目的在于保证分割结果的前提下，减少人工交互的工作量，提高了图像分类的准确率。

为实现上述目的，按照本发明的一个方面，提供了一种基于图像显著区域的图像分类方法，包括离线训练和在线测试部分：

离线训练部分包括以下步骤：

S1：对图像进行N次超像素分割得到图像N层尺度下的分割块，计算图像的N层尺度下分割块的特征对比度得到N个显著图，融合N个显著图得到目标显著图；

S2：对目标显著图进行阈值分割得到二值图像，然后对该二值图像分别作形态学处理得到图像标记，然后基于图像标记利用分割算法对目标显著图进行自动分割提取得到显著区域；

S3：将显著区域作为训练样本输入到卷积神经网络中训练，得到基于图像显著区域的图像分类器；

在线测试部分包括以下步骤：

S4：测试图像按照步骤S1和S2的方式完成测试图像的显著区域自动分割提取，然后将测试图像的显著区域图像输入到离线训练好的图像分类器，图像分类器输出图像分类结果。

进一步的，S1中的特征对比度为色彩对比度、空间对比度和纹理对比度中的一种或几种。

更进一步的，S1中的特征对比度为色彩对比度和空间对比度。

进一步的，S2中阈值设定为W和H为目标显著图S的长和宽，(x,y)为目标显著图内像素点的坐标。