[发明专利]图像的检索方法及装置在审
申请号: | 201610097309.6 | 申请日: | 2016-02-22 |
公开(公告)号: | CN107103002A | 公开(公告)日: | 2017-08-29 |
发明(设计)人: | 朱海涛 | 申请(专利权)人: | 南京中兴新软件有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 江舟,李灵洁 |
地址: | 210012 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 检索 方法 装置 | ||
技术领域
本发明涉及图像检索领域,具体而言,涉及一种图像的检索方法及装置。
背景技术
随着网络及照相设备的普及尤其是带有照相功能的手机的普及,使人们接触到的图像越来越多,因此如何在大量的图像中快速、准确的找到一副图像的相似图像变得越来越重要。
目前,相关技术中的图像检索技术有基于文本的图像检索技术和基于图像的图像检索技术;其中,基于文本的图像检索技术是早年普遍采用的一种图像检索技术,其沿用了传统的文本检索技术,通过人工给图像库中的每个图片添加标注,用于描述图像的信息,用户检索时也通过文字来检索某一类图片,如目前的百度图片依然支持这种图像检索方法。随着数字图像处理、模式识别以及机器学习等技术的发展,基于图像的图像检索技术应运而生,其大量应用数字图像处理、模式识别以及机器学习领域的原理和知识,通过特定的算法提取图像的特征,通过提取到的特征计算图像之间的相似度,并依据相似度返回图像库中相似的图片,完成整个图像检索流程。
基于文本的图像检索虽然搜索出来的图片大都是符合用户输入的待检索图片的语义,但其图像库中的每张图像都需要人工标注,需要耗费大量的人力,尤其是在互联网图片更新越来越快以及人工成本越来越高的背景下,该方法正变得越来越不实用。相关技术中的基于图像的图像检索系统大都通过计算图像在某一个或某几个特征上的相似度来检索相近的图片,如颜色特征、直方图特征、梯度特征以及几何特征等,但这些特征大都不具有语义性,导致检索处理的图片匹配度不高。
针对相关技术中的上述问题,目前尚未存在有效的解决方案。
发明内容
本发明提供了一种图像的检索方法及装置,以至少解决相关技术中图像的检索方式单一且匹配度不高的问题。
根据本发明的一个方面,提供了一种图像的检索方法,包括:提取待检索图像上用于表征图像特征属性的多个特征描述子;将提取到的特征描述子映射到预先生成的词汇表上,并统计在所述词汇表上的直方图;计算所述待检索图像的直方图与预存在图像库中各个图像的直方图的相似度,并依据计算结果从所述图像库中检索出相似度大于预设阈值的所有图像。
进一步地,在获取待检索图像上用于表征图像特征属性的多个特征描述子之前,所述方法还包括:采集各种类型的图像,并对所述各种类型的图像进行预处理得到归一化后的各种类型的图像;提取归一化后的所述各种类型的图像的特征描述子,并对所述各种类型的特征描述子进行聚类处理生成用于映射各种不同特征属性的特征描述子的词汇表。
进一步地,在通过聚类生成所述词汇表之后,所述方法还包括:提取归一化后的所有图像的特征描述子;循环处理每个图像,将每个图像上所有的特征描述子映射到词汇表上,并统计出每个图像在词汇表上各词汇的直方图;将所述直方图归一化得到每张图像在所述词汇表上的归一化后的直方图。
进一步地,所述计算所述待检索图像的直方图与预存在图像库中所有图像的直方图的相似度包括:统计所述待检索图像的直方图中每一项代表不同特征属性的特征描述子占所有特征描述子总和的比例;根据直方图中不同特征属性的特征描述子的比例值,计算所述待检索图像的直方图与预存在图像库中各个图像的直方图的相似度。
进一步地,每一直方图中所有不同特征属性的特征描述子的比例值的和为1。
根据本发明的另一个方面,提供了一种图像的检索装置,包括:特征提取模块,用于提取待检索图像上用于表征图像特征属性的多个特征描述子;第一映射模块,用于将提取到的特征描述子映射到预先生成的词汇表上,并统计在所述词汇表上的直方图;相似度计算模块,用于计算所述待检索图像的直方图与预存在图像库中各个图像的直方图的相似度,并依据计算结果从所述图像库中检索出相似度大于预设阈值的所有图像。
进一步地,所述装置还包括:第一处理模块,用于在获取待检索图像上用于表征图像特征属性的多个特征描述子之前,采集各种类型的图像,并对所述各种类型的图像进行预处理得到归一化后的所述各种类型的图像;第二处理模块,用于提取归一化后的所述各种类型的图像的特征描述子,并对所述各种类型的特征描述子进行聚类处理生成用于映射各种不同特征属性的特征描述子的词汇表。
进一步地,所述装置还包括:提取模块,用于提取归一化后的所述所有图像的特征描述子;第二映射模块,用于循环处理每个图像,将每个图像上所有的特征描述子映射到词汇表上,并统计出每个图像在词汇表上各词汇的直方图;归一化模块,用于将所述直方图归一化得到每张图像在所述词汇表上的归一化后的直方图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京中兴新软件有限责任公司,未经南京中兴新软件有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610097309.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序