[发明专利]对象跟踪装置和方法在审
申请号: | 201610229116.1 | 申请日: | 2016-04-13 |
公开(公告)号: | CN107301651A | 公开(公告)日: | 2017-10-27 |
发明(设计)人: | 佐藤洋一郎 | 申请(专利权)人: | 索尼公司 |
主分类号: | G06T7/223 | 分类号: | G06T7/223;G06T7/90 |
代理公司: | 北京德恒律治知识产权代理有限公司11409 | 代理人: | 章社杲,卢军峰 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对象 跟踪 装置 方法 | ||
技术领域
本发明一般地涉及计算机视觉领域,更具体地,涉及一种目标跟踪装置和方法。
背景技术
目标跟踪技术用于自动对焦、自动白平衡和自动曝光,以用相机装置拍摄期望的图像和视频。然而,参考图1A,在传统的目标跟踪方法中跟踪输出矩形102(即,跟踪输出区域或跟踪输出框)适合于跟踪目标A的尺寸和形状,尤其当跟踪目标A和障碍物B发生部分重叠,即,跟踪目标A和障碍物B均出现在跟踪输出矩形中时,这种传统的目标跟踪方法容易错误地跟踪相似或相同的目标障碍物B。例如,如果目标跟踪技术用于自动对焦功能,则因为拍摄的图像的对焦区域会是错误的障碍物,所以错误的跟踪结果会导致拍摄模糊不清的图像。
其他方法具有传统目标跟踪方法的输出数据格式。大部分传统的目标跟踪方法的输出信息是矩形,该矩形适合于跟踪目标尺寸和形状。但是对于相机的自动对焦功能,这种矩形是低自动对焦精度的原因。因为矩形信息包含背景区域,自对对焦模块有时会聚焦在跟踪输出矩形内部的背景区域上。例如,参考图2A,将左侧的输入图像进行转换并输出右侧的图像,由于输出图像的跟踪输出矩形中包括多个背景区域(例如,图2A中的5个背景区域),所以在相机自动对焦时,有时会聚焦在跟踪输出矩形内部的背景区域上。
发明内容
为了解决现有技术中所存在的错误地跟踪相似或相同的目标障碍物、拍摄模糊不清的图像或者自动对焦在跟踪输出矩形内部的背景区域上的技术问题,本发明提出了以下对象跟踪装置和方法。
根据本发明的一方面,提供了一种对象跟踪装置,包括处理器和存储器,处理器包括:图像预处理模块,用于对输入图像的背景区域进行归一化处理,以获得具有固定尺寸的背景区域的归一化的图像;超像素匹配模块,用于使用超像素算法将归一化的图像转换为超像素图像并将超像素图像和参照超像素区域进行匹配,以在超像素图像中找到具有与参照超像素区域相似度高的超像素颜色的匹配区域;以及背景屏蔽模块,用于对具有匹配区域的超像素图像进行屏蔽处理以获得匹配区域之外的背景区域被屏蔽的超像素屏蔽图像。
优选地,图像预处理模块还包括对象概率估计子模块,对象概率估计子模块用于使用前景区域和背景区域的颜色直方图来计算每个像素的对象概率,并且执行均值平移以将前景区域平移至适当位置。
优选地,超像素匹配模块还用于通过应用超像素图像将对象概率转换为超像素级对象概率,超像素级对象概率为具有相同的超像素标记的对象概率的平均值。
优选地,背景屏蔽模块进一步用于:将位于匹配区域外部的超像素标记为超像素屏蔽图像的背景并将背景设置为黑色;当匹配区域的内部的超像素颜色与参照超像素区域的超像素颜色相似时,将位于匹配区域内部的超像素标记为前景并将前景设置为白色;以及当匹配区域的内部的超像素颜色与参照超像素区域的超像素颜色不相似时,将位于匹配区域内部的超像素标记为中景并将中景设置为灰色。
优选地,背景屏蔽模块还用于将超像素屏蔽图应用于超像素级对象概率并且生成屏蔽概率图。
优选地,将超像素屏蔽图应用于超像素级对象概率并且生成屏蔽概率图进一步包括:当超像素屏蔽图像标记为前景时,屏蔽概率图的概率为1;当超像素屏蔽图像标记为中景时,屏蔽概率图的概率具有与对象概率相同的概率;以及当超像素屏蔽图像标记为背景时,屏蔽概率图的概率为0。
优选地,对象区域归一化子模块用于通过与输入图像的背景区域相同的长宽比,将输入图像的背景区域缩放至固定尺寸,以获得具有固定尺寸的背景区域的归一化的图像。
优选地,对象跟踪装置还包括对象区域估计模块,用于求解马尔科夫随机场MRF以生成超像素对象二值图;基于对象二值图计算最终的输出区域;计算输出区域的颜色直方图和先前帧的参照直方图之间的直方图相似度,以判定 跟踪成功;以及存储最终的输出区域中的超像素信息。
优选地,参照超像素区域是先前帧的跟踪对象区域,输入图像的背景区域是输入图像的第一帧中的初始框或在每幅后续图像中的先前帧的跟踪框。
根据本发明的另一方面,提供了一种对象跟踪方法,包括:对输入图像的背景区域进行归一化处理,以获得具有固定尺寸的背景区域的归一化的图像;以及基于使用超像素算法将归一化的图像转换为超像素图像并将超像素图像和参照超像素区域进行匹配,以在超像素图像中找到具有与参照超像素区域的相似度最高的超像素颜色的匹配区域;以及对具有匹配区域的超像素图像进行屏蔽处理以获得匹配区域之外的背景区域被屏蔽的超像素屏蔽图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610229116.1/2.html,转载请声明来源钻瓜专利网。