[发明专利]基于视觉词组的图像检索方法有效
申请号: | 201110205412.5 | 申请日: | 2011-07-21 |
公开(公告)号: | CN102254015A | 公开(公告)日: | 2011-11-23 |
发明(设计)人: | 冯德瀛;杨杰;杨程;刘从新 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视觉 词组 图像 检索 方法 | ||
技术领域
本发明涉及的是计算机信息处理技术领域的方法,具体是一种基于视觉词组的图像检索方法。
背景技术
随着具有拍照功能的手机价格更加低廉以及互联网的发展,图像的获取更加简捷方便,图像数量也呈现爆炸性的增长。图像数量的快速增长对图像数据的存储、搜索和组织提出了巨大的挑战和考验。在现实生活中,如何在大规模图像库中根据手机拍摄图像获取最有用的信息,成为人们关注和研究的焦点之一。
图像检索技术是指根据查询图像内容信息或者指定查询标准,在标准图像库中进行搜索并查找出符合条件的相关图像。传统的图像检索技术大多采用基于文本的检索方法,它沿用了传统的文本检索技术,从图像名称、图像尺寸、压缩类型、作者、年代等方面描述图像,通过关键词的形式查询图像。基于文本的图像检索技术,不能对图像低层特征元素进行客观分析和描述,逐渐被基于内容的图像检索技术所取代。
基于内容的图像检索技术,早期大多采用颜色、纹理、形状等全局特征进行相似性搜索,但是这些特征对于光照、遮挡以及几何形变等不具有稳健性,因此逐渐被SIFT、SURF等局部不变性特征描述子所取代。与传统的图像全局特征相比,图像的局部不变性特征具有更好的唯一性、不变性和鲁棒性,能够适应图像背景混杂、局部遮挡、光线变化等各种情况,因此适用于在各种情况下拍摄的手机图像。将图像的局部不变性特征进行聚类量化,并在高维索引结构中进行相似性搜索,即可根据手机拍摄图像在标准图像库中查询出相关结果。
经对现有技术的文献检索发现, Andrew Zisserman等在专利“Object Retrieval”(美国专利号为US 2005/0225678 A1,公开日期为2005年12月13日)中提供了用户在图像中自定义目标进行检索的方法。在该方法中,首先采用形状自适应与最大稳健区域进行特征提取,并采用SIFT描述子进行特征描述,然后采用K-Means聚类方法对所有SIFT描述子进行聚类,创建视觉码书,接着进行标准图像矢量化,并根据标准图像矢量的稀疏性创建倒排索引,进行相似性搜索。在创建视觉码书的过程中,标准图像中的每个SIFT描述子通过一个聚类中心进行表示,从而降低了同一类别SIFT描述子之间的区分性,造成了量化损失。在待检索图像查询过程中,必须先对待检索图像的SIFT描述子进行矢量化,然后才能在倒排索引中进行相似性查询,待检索图像矢量化过程以及待检索图像和标准图像相似性度量过程耗费了不少时间,从而降低了检索的实时性。
进一步检索发现,David Nister等在专利“Scalable Object Recognition Using Hierarchical Quantization with a Vocabulary Tree”(美国专利号为US7725484 B2,公开日期为2010年5月25日)中提供了一种图像检索方法。该方法在K-Means聚类的基础上引入了分层的概念,虽然降低了传统K-Means聚类的时间,但是属于同一类别的描述子往往会被划分到不同的类别中,以及同一类别SIFT描述子之间不存在区分性的问题,造成了更大的量化损失。在待检索图像查询的过程中,由于同样要进行矢量化以及倒排索引相似性搜索,从而也降低了检索的实时性。
发明内容
本发明针对现有技术存在的上述不足,提供一种基于视觉词组的图像检索方法,通过基于视觉词组的二维倒排索引以及对图像进行空间几何关系度量得以实现,能够提高图像中尺度不变描述子的区分性,并在保证检索准确率的同时,降低检索过程中的计算量,提高了检索的实时性。
本发明是通过以下技术方案来实现的,本发明具体为:
首先对标准图像和待检索图像分别提取显著性区域,并在显著性区域中提取特征描述子;
然后对标准图像库中的特征描述子采用随机kd树进行聚类;
接着将标准图像和待检索图像的特征描述子分别通过视觉词组进行表示,并根据标准图像的视觉词组创建二维倒排索引;
最后将由视觉词组表示的待检索图像的特征描述子在二维倒排索引中进行相似性搜索以及空间几何关系度量,给出最终检索结果。
所述的对标准图像和待检索图像分别提取显著性区域是指:将图像从空间坐标变换到频率坐标,计算图像的对数谱,并将其与滤波后的对数谱进行差分得到谱残差,进而反变换得到显著性区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110205412.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:雕塑造型儿童皂
- 下一篇:一种流体通道的设计、计算方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序