[发明专利]图像分类的方法和系统、图像检索的方法和系统无效
申请号: | 201210110400.9 | 申请日: | 2012-04-13 |
公开(公告)号: | CN103377376A | 公开(公告)日: | 2013-10-30 |
发明(设计)人: | 贾宇 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 赵娟 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分类 方法 系统 检索 | ||
技术领域
本申请涉及电子图像数据处理的技术领域,特别是涉及一种图像分类的方法,一种图像分类的系统,一种图像检索的方法,以及,一种图像检索的系统。
背景技术
随着现代电子计算机技术及Internet网络的迅速发展,庞大的、多样的图像信息不断出现,各行各业对图像的使用越来越广泛,进而推动了图像信息资源管理研究进一步发展。现在的图像广泛地分布在互联网上,缺少有效的组织,难以达到资源共享的目的。因此,如何利用海量的图像信息并从中找出需要的信息,是对图像信息查询技术提出的重大挑战。
20世纪90年代初期开始,基于图像的内容如颜色、形状、纹理和空间关系等特征来检索图像的技术(CBIR)应运而生,具体应用如大型的图像检索系统QBIC,Visualseek,Virage,Photobook等。CBIR克服了传统方法的不足,融合了图像识别和数据库技术,从而提供了更有效的检索和分类手段。然而图像的数字化表征,并不能很好地揭示其内在的本质,深层的语义内容得不到很好的反映。单纯的底层数字特征已经没有办法为图像的有效管理提供更好的支持。
中国专利号为ZL200810105980.6,发明名称为“一种基于带权图的半监督图像分类方法”的专利在2008年10月29日公开了一种通过分割图像,提取各个区域特征进行带权图的构建,并结合已标注图像的信息进行分类的方法,具体包括如下步骤:
在对数字图像进行分割的基础上,提取区域特征并计算各个区域面积占整幅图像面积的比例;
使用线性规划构建带权图;
使用标签传播的方法在带权图上传递已标注图像的类别信息;
最后根据类别信息传递的最终结果,对未标注图像进行分类。
上述方案使用线性规划构建带权图,其中需要设定的参数为近邻图像的数目,当该参数在较大的范围内变化时,得到的图像分类结果比较稳定,从而有效地克服了基于高斯函数构建带权图的方法中参数对分类结果影响较大的问题。
然而,这种现有技术仍存在下述缺点和不足:
1、准确性不足。
现有技术在处理图像特征上依赖图像的底层数字特征,而纯底层的数字特征不能完整刻画图像的全部信息,因此在分类结果中会造成很大的准确性不足问题。比如,一张包含一匹红色的侧面马的照片和一张包含一匹白色的正面马的照片,其底层特征(颜色、形状和纹理)差距极大,单纯的依赖底层的数字特征,会造成两幅图像分类不准确,即不一定能都分类到“马”这一类的图像中。
2、实现复杂度高和参数依赖。
对于图像的分类,主要计算量存在于特征提取和分类器的构造方面,实现复杂度非常高;再者,上述现有技术需要设置较多的参数,对参数有过度依赖性,并且其中计算时依赖所有的图像。
3、图像的主观意义结合度不高。
现有技术单纯地依赖底层数字特征或者关键词的文字匹配将影响图像的相关性,比如“电脑”和“计算机”是等同的概念,但是如果将这两个词作为某两幅差别很大的图像描述,那么将导致这两幅图像可能分配不到同一个类别中。
因而,目前本领域技术人员迫切需要解决的问题是,提出一种全新的图像分类机制,用以提高图像分类的准确性和处理效率,降低分类处理的复杂度,并增加图像分类的相关性,同时提高图像检索的准确率和处理效率,提升用户进行图像检索的使用体验。
发明内容
本申请的目的是提供一种图像分类的方法和系统,用以提高图像分类的准确性和处理效率,降低分类处理的复杂度,并增加图像分类的相关性。
本申请的又一目的是提供一种图像检索的方法和系统,用以提高图像检索的准确率和处理效率,提升用户进行图像检索的使用体验。
为了解决上述问题,本申请公开了一种图像分类的方法,包括:
将图像分割为若干子区域;
在所述子区域中提取焦点子区域;
对所述焦点子区域进行颜色语义映射,获得语义特征;
采用所述图像分类特征进行图像分类,所述图像分类特征包括语义特征。
优选的,所述在子区域中提取焦点子区域的步骤包括:
针对所述子区域建立视觉焦点权重模型;
按照所述视觉焦点权重的大小选择满足第一预设条件的子区域为焦点子区域。
优选的,所述在子区域中提取焦点子区域的步骤包括:
针对所述子区域建立视觉焦点权重模型;
按照所述视觉焦点权重的大小选择满足第二预设条件的子区域,并针对所述子区域进行视觉焦点合并,将所述合并的子区域作为焦点子区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210110400.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带座水润滑调心轴承
- 下一篇:高性能恒流源电路
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序