[发明专利]基于中心估计的图形目标检索定位方法有效
申请号: | 201310435471.0 | 申请日: | 2013-09-22 |
公开(公告)号: | CN103514276A | 公开(公告)日: | 2014-01-15 |
发明(设计)人: | 肖莉;刘贵忠;庄志超 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/32 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 汪人和 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 中心 估计 图形 目标 检索 定位 方法 | ||
技术领域
本发明属于图像检索技术领域,具体涉及一种基于中心估计的图形目标检索定位方法。
背景技术
随着计算机网络与多媒体技术的快速发展,图像和音频视频等多媒体内容正在以爆炸式的速度急剧增长,人们获取信息的途径随之也发生了根本的改变。图像作为承载信息的一种重要形式,因其内容丰富、展现直观并且易于存储的优势已经成为人们日常生活中不可或缺的信息来源。但是庞大复杂的网络系统使得无以计数的图像资源存储在纷繁交错的网络端点。如何在大规模的网络数据集中依照用户给定的目标进行图像的检索,获取用户感兴趣的图像具有重要的研究意义。
文本检索方法相较于图像检索方法发展更早也更为成熟,因此早期的图像检索是通过对图像添加文本标签的方式将图像检索转化为文本检索。以百度、Google为代表的商用搜索引擎中图像检索主要利用的就是这种方法。这种方法存在固有缺陷:首先需要对图像额外添加文本信息;而且检索质量非常依赖于文本标签的正确性;另外有一些图像很难准确地用文本进行表达。为了克服这些缺陷研究者们开始了基于内容的图像检索方法的研究。基于内容的图像检索方法对图像自身进行分析,提取具有视觉信息的特征向量,利用特征向量进行图像的相似性比较。其中用于检索的图像称为查询图像。
图像具有丰富的视觉信息,其中也许包含了多个目标物。如果利用整幅图像作为查询图像,那么图像中的各个目标物将具有同等的重要性,这会导致搜索目标的模糊和搜索结果的偏离。而且实际情况下,给定一幅查询图像时,人们关心的往往是图像中的某一个目标。由用户框定查询图像中感兴趣的目标区域进行检索,能够更加充分明确地表达用户的检索意图。如何从大规模的图像数据集中快速鲁棒地检索出存在目标区域的相关图像并对目标区域进行定位具有重要的实用价值。另外,数据集图像中可能存在多个查询的目标区域,如何准确地定位出现的所有目标区域也是一个巨大的挑战。
随着图像数据集规模的不断增大,研究者们引入了倒排索引结构。倒排索引结构根据视觉词汇对提取的图像特征向量进行有效地组织,能够有效地提高基于内容的图像目标检索的效率并且能够降低特征存储的负担。虽然倒排索引技术的引入有效地提高了图像目标检索的效率,然而构建倒排索引过程中对特征的量化操作带来的误差将会造成特征的错误匹配,影响图像目标检索的质量。
发明内容
为了克服上述现有技术存在的缺陷,本发明的目的在于提供一种基于中心估计的图形目标检索定位方法,该方法能够有效应对图像变化,准确、快速地为客户返回查找的目标区域的图像。
本发明是通过以下技术方案来实现:
基于中心估计的图形目标检索定位方法,包括以下步骤:
第一步,根据查询图像的量化信息和倒排索引结构,得到查询图像与数据集图像的匹配特征对;
第二步,利用匹配特征对的位置和尺度方向信息,估计目标区域的中心位置;
第三步,通过中心位置直方图去除错误匹配的特征对;
第四步,利用正确匹配特征对计算候选图像的匹配分值,根据匹配分值排序返回检索结果;同时,利用正确匹配特征对,得到候选图像中目标区域的定位。
第一步所述的查询图像与数据集图像的匹配特征对是通过以下步骤得到的:
1)查询图像目标区域内特征向量,量化到距离最近视觉词汇构成查询图像的量化信息;
2)利用量化信息在倒排索引结构中查找,量化到相同视觉词汇的特征为匹配特征,得到查询图像与数据集图像的匹配特征对。
所述的视觉词汇是指由图像特征聚类过程得到的类中心向量。
所述的倒排索引结构是对数据集中所有图像特征按视觉词汇构建的组织结构,以视觉词汇为索引记录数据集中特征出现图像号以及特征的位置、尺度和方向信息。
第二步所述的利用匹配特征对的位置和尺度方向信息,估计目标区域的中心位置,具体包括以下步骤:
1)根据查询图像中的特征点的位置和目标区域中心点位置,得到一个从特征点指向中心点的向量,表示为
2)利用特征点的尺度方向和平移变化来估计目标区域的空间变化,得到候选图像中变换后的向量记为
其中,向量是候选图像中从特征点指向目标区域中心位置的向量,由向量终点得到候选图像中目标区域的中心位置的估计值。
第三步所述的通过中心位置直方图去除误匹配的特征,具体包括以下步骤:
1)利用二维直方图进行中心确认,将候选图像划分为N*M的方格;
2)利用目标区域的中心位置的估计值对图像方格进行加权投票;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310435471.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高强度奥氏体不锈钢埋弧焊焊丝
- 下一篇:一种锯床的移动工作台