[发明专利]基于变形敏感的软级联模型的视频拷贝检测方法及系统有效
申请号: | 201210238553.1 | 申请日: | 2012-07-10 |
公开(公告)号: | CN102737135A | 公开(公告)日: | 2012-10-17 |
发明(设计)人: | 田永鸿;姜梦林;黄铁军 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 毛燕生 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 变形 敏感 级联 模型 视频 拷贝 检测 方法 系统 | ||
1.一种基于变形敏感的软级联模型的视频拷贝检测方法,其特征在于包括以下步骤:
预处理步骤,从查询视频中提取出格式一致的视觉关键帧和音频帧;
变形识别步骤,判定查询视频经受的变形的类别,并将它传递给该类别对应的级联检测器链;
检测步骤,级联检测器链中的检测器依次处理所述查询视频,直到其中一个检测器判定它为拷贝,或者所有检测器判定它为非拷贝。
2.根据权利要求1所述的一种基于变形敏感的软级联模型的视频拷贝检测方法,其特征在于所述变形识别步骤,利用WASF特征来判断查询视频是否是静音的,利用WASF特征与支持向量机SVM来判断查询视频是否经受了内容改变的音频变形,利用DCSIFT BoW特征与SVM来判断查询视频是否经受了内容改变的视觉变形。
3.根据权利要求1所述的一种基于变形敏感的软级联模型的视频拷贝检测方法,其特征在于每一个检测器包括以下检测步骤:
帧层次检索步骤,利用一种视觉特征或音频特征检索查询视频的视觉关键帧或音频帧,得到最相似的参考视频的视觉关键帧或音频帧,查询视频的视觉关键帧或音频帧与检索到的参考视频的视觉关键帧或音频帧构成帧层次匹配的集合;
时域金字塔匹配TPM步骤,利用时域金字塔匹配TPM处理帧层次匹配的集合,得到与查询视频最相似的参考视频,以及两者的相似度,查询视频与返回的参考视频构成一个视频匹配。
4.根据权利要求3所述的一种基于变形敏感的软级联模型的视频拷贝检测方法,其特征在于所述视觉特征和音频特征至少包含一种效果好的局部视觉特征、一种速度快的全局视觉特征以及一种速度快的音频特征,每种特征对应一个检测器。
5.根据权利要求3所述的一种基于变形敏感的软级联模型的视频拷贝检测方法,其特征在于所述时域金字塔匹配TPM将查询视频和参考视频分割为越来越精细的子段,并在多个粒度上计算视频之间的相似度;在每一个粒度上,只有位于对应子段的帧层次匹配被保留下来,并参与该粒度上的相似度的计算;各个粒度上的相似度的加权和构成最终的相似度。
6.根据权利要求1所述的一种基于变形敏感的软级联模型的视频拷贝检测方法,其特征在于所述检测步骤,级联检测器链上的检测器依次处理查询视频,每一个检测器返回与查询视频最相似的参考视频及相似度,若相似度大于等于某个预先设定的阈值,则判定查询视频是拷贝,并终止运行,否则执行下一个检测器;仅当所有检测器全部判定查询视频为非拷贝时,系统才会接受它为非拷贝视频。
7.根据权利要求6所述的一种基于变形敏感的软级联模型的视频拷贝检测方法,其特征在于使用阈值学习算法,自动为级联检测器链选择出最优的相似度阈值向量;每一个相似度阈值对应一个检测器,用于判定查询视频是否是拷贝。
8.根据权利要求7所述的一种基于变形敏感的软级联模型的视频拷贝检测方法,其特征在于所述阈值学习算法定义了检测器在一个训练视频集上的错误率;对于给定的检测器和训练视频集,所述错误率取决于检测器使用的相似度阈值以及所有训练视频的权重。
9.根据权利要求7所述的一种基于变形敏感的软级联模型的视频拷贝检测方法,其特征在于所述阈值学习算法在为一个检查器挑选最优阈值的时候,将阈值设定为一系列值并分别计算检测器的错误率,与最小错误率相对应的阈值就被选作最优阈值;阈值的取值范围是检测器为所有训练视频返回的视频匹配的相似度的集合。
10.根据权利要求7所述的一种基于变形敏感的软级联模型的视频拷贝检测方法,其特征在于所述阈值学习算法在为一个检查器挑选出最优阈值之后,会减小该检测器检测正确的训练视频的权重;权重减小的程度取决于检测器的最小错误率,最小错误率越小,权重减小的程度越大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210238553.1/1.html,转载请声明来源钻瓜专利网。