[发明专利]用于处理图像的方法有效
申请号: | 201280063487.7 | 申请日: | 2012-04-20 |
公开(公告)号: | CN104012093B | 公开(公告)日: | 2018-02-02 |
发明(设计)人: | 基奥万尼·科达拉;爱默德·鲍阿齐齐;卢卡斯·康德拉德 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04N19/136 | 分类号: | H04N19/136;H04N19/176;H04N19/132;H04N19/129;G06K9/46 |
代理公司: | 北京亿腾知识产权代理事务所11309 | 代理人: | 陈霁 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 处理 图像 方法 | ||
技术领域
本发明涉及计算机视觉领域的图像处理技术,尤其涉及通常称为视觉搜索或增强现实的主题。在视觉搜索和增强现实应用中,从某个图像或图像序列中提取的信息发送到服务器,在服务器上该信息与从参考图像或图像序列数据库中提取的信息相比较。参考图像或图像序列表示待识别物体的模型。在该背景下,本发明涉及对从发送到服务器的图像或图像序列中提取的信息的压缩,尤其涉及从图像或图像序列中提取的兴趣点的位置压缩。
背景技术
视觉搜索(VS)为自动化系统通过仅分析图像或图像序列的可视部分而不利用任何外部数据(例如文本描述、元数据等)来识别某个图像或图像序列中描绘的一个物体或多个物体的能力。增强现实(AR)可以视作VS的高级用法,尤其可以应用到移动领域。在识别了图像序列中描绘的物体后,将附加内容(通常为合成物体)叠加到真实场景中,从而‘增强’了真实内容,其中合成物体的位置与真实物体的一致。识别图像序列中描绘的物体的实现技术是相同的。下文中术语“图像”和“图片”同义使用。
当前,视觉搜索的主要方法依赖于确定所谓的局部特征,在文献和下文中也被称为特征或描述符。常用方法为尺度不变特征变换(SIFT),如“D.Lowe,来自尺度不变关键点的独特图像特征,计算机视觉国际期刊第60卷,第2册,2004年,第91至110页”中所述,以及加速稳健特征(SURF),如“Bay,T.Tuytelaars,L.V.Gool,SURF:加速稳健特征,欧洲计算机视觉大会(ECCV)论文,格拉茨,奥地利,2006年,http://www.vision.ee.ethz.ch/~surf/”中所述。文献中可以找到这些技术的许多变体,这些变体可以视作对这两种原始技术的改进。
从图13可以看出,局部特征是一种紧凑描述,例如图像1301中的点1305周围的片段1303的SIFT中每个特征为128字节。图13示出了局部特征的提取(图13的上半部分)和表示(图13的下半部分)。在图13的上半部分,局部特征所在点的位置经计算并由表示图像1301中的点1305的圆圈指示,该圆圈被表示取向片段1303的正方形包围。在图13的下半部分,片段1303的网格1309的细分部分包含了局部特征的直方图分量1311。为了计算局部特征,基于点1305周围的主梯度分量计算点1305的主方向1307。从方向1307开始,提取面向主方向1307的片段1303。随后将片段1303细分为矩形或径向网格1309。为网格1309中的各个元素计算局部梯度的直方图1311。为网格1309的元素所计算的直方图1311表示局部特征的分量。该描述符1313包含了如图13的下部所示的网格1309的元素的直方图1311,描述符1313的特征与旋转、照度和透视失真无关。
在图像1301中,点1305(可以基于该点计算描述符1313)通常涉及场景的特有元素,例如边角、具体图案等。这些点通常称为关键点1305,即图13的上半部分描绘的圆圈。计算关键点1305的过程基于识别多尺度图像1301表示中的局部极值。
当比较两个图像1301和1401时,如图14所示,将第一图像1301的各个描述符1313与第二图像1401的各个描述符比较。图14仅示出了图像1301和1401,未示出描述符。通过采用距离测量,在不同的关键点(例如第一图像1301中的第一关键点1305与第二图像1401中的第二关键点1405)之间识别匹配。正确的匹配(通常称为内点1407)需要在图像1301和1401中具有一致的相对位置,尽管可能存在尺寸缩放、旋转、透视失真。匹配阶段中可能出现的由于提取关键点所采用的统计方法导致的错误随后通过称为几何一致性检查的阶段消除,在该几何一致性检查阶段中估计不同关键点位置的一致性。这些错误(通常称为外点1409)被移除,如图14中的虚线所示。
根据剩余内点1407的数目,可以估计两个图像1301和1401中是否存在相同的物体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280063487.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种摩托车启动轴上的启动齿轮结构
- 下一篇:调频止晃弹簧装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序