[发明专利]基于中心估计的图形目标检索定位方法有效

申请号：	201310435471.0	申请日：	2013-09-22
公开（公告）号：	CN103514276A	公开（公告）日：	2014-01-15
发明（设计）人：	肖莉;刘贵忠;庄志超	申请（专利权）人：	西安交通大学
主分类号：	G06F17/30	分类号：	G06F17/30;G06K9/32
代理公司：	西安通大专利代理有限责任公司 61200	代理人：	汪人和
地址：	710049 ***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于中心估计图形目标检索定位方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于图像检索技术领域，具体涉及一种基于中心估计的图形目标检索定位方法。

背景技术

随着计算机网络与多媒体技术的快速发展，图像和音频视频等多媒体内容正在以爆炸式的速度急剧增长，人们获取信息的途径随之也发生了根本的改变。图像作为承载信息的一种重要形式，因其内容丰富、展现直观并且易于存储的优势已经成为人们日常生活中不可或缺的信息来源。但是庞大复杂的网络系统使得无以计数的图像资源存储在纷繁交错的网络端点。如何在大规模的网络数据集中依照用户给定的目标进行图像的检索，获取用户感兴趣的图像具有重要的研究意义。

文本检索方法相较于图像检索方法发展更早也更为成熟，因此早期的图像检索是通过对图像添加文本标签的方式将图像检索转化为文本检索。以百度、Google为代表的商用搜索引擎中图像检索主要利用的就是这种方法。这种方法存在固有缺陷：首先需要对图像额外添加文本信息；而且检索质量非常依赖于文本标签的正确性；另外有一些图像很难准确地用文本进行表达。为了克服这些缺陷研究者们开始了基于内容的图像检索方法的研究。基于内容的图像检索方法对图像自身进行分析，提取具有视觉信息的特征向量，利用特征向量进行图像的相似性比较。其中用于检索的图像称为查询图像。

图像具有丰富的视觉信息，其中也许包含了多个目标物。如果利用整幅图像作为查询图像，那么图像中的各个目标物将具有同等的重要性，这会导致搜索目标的模糊和搜索结果的偏离。而且实际情况下，给定一幅查询图像时，人们关心的往往是图像中的某一个目标。由用户框定查询图像中感兴趣的目标区域进行检索，能够更加充分明确地表达用户的检索意图。如何从大规模的图像数据集中快速鲁棒地检索出存在目标区域的相关图像并对目标区域进行定位具有重要的实用价值。另外，数据集图像中可能存在多个查询的目标区域，如何准确地定位出现的所有目标区域也是一个巨大的挑战。

随着图像数据集规模的不断增大，研究者们引入了倒排索引结构。倒排索引结构根据视觉词汇对提取的图像特征向量进行有效地组织，能够有效地提高基于内容的图像目标检索的效率并且能够降低特征存储的负担。虽然倒排索引技术的引入有效地提高了图像目标检索的效率，然而构建倒排索引过程中对特征的量化操作带来的误差将会造成特征的错误匹配，影响图像目标检索的质量。

发明内容

为了克服上述现有技术存在的缺陷，本发明的目的在于提供一种基于中心估计的图形目标检索定位方法，该方法能够有效应对图像变化，准确、快速地为客户返回查找的目标区域的图像。

本发明是通过以下技术方案来实现：

基于中心估计的图形目标检索定位方法，包括以下步骤：

第一步，根据查询图像的量化信息和倒排索引结构，得到查询图像与数据集图像的匹配特征对；

第二步，利用匹配特征对的位置和尺度方向信息，估计目标区域的中心位置；

第三步，通过中心位置直方图去除错误匹配的特征对；

第四步，利用正确匹配特征对计算候选图像的匹配分值，根据匹配分值排序返回检索结果；同时，利用正确匹配特征对，得到候选图像中目标区域的定位。

第一步所述的查询图像与数据集图像的匹配特征对是通过以下步骤得到的：

1）查询图像目标区域内特征向量，量化到距离最近视觉词汇构成查询图像的量化信息；

2）利用量化信息在倒排索引结构中查找，量化到相同视觉词汇的特征为匹配特征，得到查询图像与数据集图像的匹配特征对。

所述的视觉词汇是指由图像特征聚类过程得到的类中心向量。