[发明专利]一种由粗到精的视频事件的快速定位方法无效

专利信息
申请号: 201010593169.4 申请日: 2010-12-17
公开(公告)号: CN102156702A 公开(公告)日: 2011-08-17
发明(设计)人: 吴娴;杨兴锋;王春芙;张东明;何崑 申请(专利权)人: 南方报业传媒集团
主分类号: G06F17/30 分类号: G06F17/30;G06T7/00
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 杨晓松
地址: 510601 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 粗到精 视频 事件 快速 定位 方法
【说明书】:

技术领域

发明属于视频事件定位方法研究领域,特别涉及一种由粗到精的视频事件的快速定位方法。

背景技术

视频事件的定位在视频检索、视频浏览、智能监控和人体运动分析等方面有着广泛的应用。目前视频事件的定位方法主要分为两类:基于学习的方法和无需学习的方法。基于学习的方法需要对每种查询事件建立训练模型,但是因为模型的训练需要调整多项参数,可能出现过拟合现象。无需学习的方法不需要训练只需用户提供相应的查询事件即可以进行视频事件的定位,搜索得到查询事件在真实视频中所处的空时位置。这类方法以查询事件作为模板在真实视频中进行匹配搜索,但真实视频通常持续较长时间,且其搜索区域是X-Y-T三维空间,从而会产生巨大的计算花费,因此穷举搜索法显得不太可行。为了降低巨大的搜索空间,现在多采用对真实视频进行下采样的方法,或是只在时间和空间固定尺度上的采样空间中进行简单定位,但这种做法查全率较低,并且大量时间仍被浪费在真实视频中不可能存在查询事件的空时位置上,不够实用。

E.Shechtman,和M.Irani在2007年的CVPR(Computer Vision and PatternRecognition,计算机视觉与模式识别)会议上发表了一篇名称为:Matching localself-similarities across images and videos的文章,该文章公开了一种根据局部自相似特征来测量视频事件相似性的方法,该方法通过在X-Y-T方向上不重叠地划分视觉体,然后挖掘局部自相似特征从而度量图像或视频的相似性。

H.J.Seo和P.Milanfar在2009年的IEEE International Conference onComputer Vision杂志上发表了一篇名称为:Detection of human actions from asingle example的文章,该文章公开了的算法是先计算显著的空时局部回归核特征,然后采用余弦相似测度度量查询事件与输入视频中每个立方体相似的可能性。

以上两种方法仅提供了可视化的实验结果,并没有对检测率进行统计,无法定量地进行精确比较。并且采用以上两种方法实现查询事件在视频中的定位必须在X-Y-T的完全空间中进行搜索,为了降低巨大的搜索空间,它们均对原始视频进行下采样,这种做法比较容易产生漏检,且大量计算代价仍被花费在不可能包含查询事件的空时位置上。以上的技术缺陷使得现有视频事件的定位方法无论从性能还是时间效率上,并没有达到实用要求,限制了此方法的应用范围。

因此,研究一种既能精确定位又无需大量搜索时间的视频事件的快速定位方法成为一个有实际意义的课题。

发明内容

本发明的主要目的在于克服现有技术的缺点与不足,提供一种由粗到精的视频事件的快速定位方法,其既能精确定位又无需大量搜索时间,减少计算代价。

本发明的目的通过以下的技术方案实现:一种由粗到精的视频事件的快速定位方法,具体包括以下步骤:

(1)感兴趣空时体的粗搜索:通过对真实视频的时间分割得到一组最有可能包含查询事件的视频片断,通过对真实视频的空间分割得到每帧图像的感兴趣区域,将视频片断中每帧图像的感兴趣区域规范化后按时序堆叠起来即构成感兴趣空时体集合,其中对真实视频的时间分割包括空时兴趣点检测、对空时分体进行HOG(Histograms of Oriented Gradients,梯度方向直方图)特征和HOF(Histograms of Optical Flow,光流直方图)特征提取、采用卡方距离方法对空时分体进行特征匹配、采用分类算法确定视频片段起止点;对真实视频的空间分割包括利用历史帧和当前帧信息构造时间显著图、根据时间显著图的计算结果确定空间感兴趣区域;

(2)感兴趣空时体集合与查询事件的精匹配:采用空时自相似性算子对查询事件和目标体的局部几何结构分别进行描述,并将所有像素的自相似体转化为向量,然后采用PCA(Principal Component Analysis,主成分分析)方法提取显著特征并采用余弦相似性进行度量,构造出相关体,然后在相关体上采用全局显著性测试得到显著点,最后根据显著点分布来判断在每个目标体中是否存在与查询样本相似的事件;

(3)查询事件的精确定位:采用区域增长/分裂合并技术和非最大值抑制方法进行后处理,用于控制最佳匹配显著点周围的空时区域定位。最后根据事先记录的每个目标体在真实视频中的空时位置,将目标体映射到真实视频,以Y方向上的尺寸为基准,采用固定大小的矩形边框在真实视频的每帧图像中显示视频事件的精确定位结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方报业传媒集团,未经南方报业传媒集团许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010593169.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top