[发明专利]一种广告视频检测的方法有效
申请号: | 200610080667.2 | 申请日: | 2006-05-25 |
公开(公告)号: | CN101080028A | 公开(公告)日: | 2007-11-28 |
发明(设计)人: | 彭宇新;肖建国 | 申请(专利权)人: | 北大方正集团有限公司;北京大学;北京北大方正技术研究院有限公司 |
主分类号: | H04N17/02 | 分类号: | H04N17/02 |
代理公司: | 北京同达信恒知识产权代理有限公司 | 代理人: | 李欣 |
地址: | 100871北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 广告 视频 检测 方法 | ||
1、一种广告视频检测的方法,包括以下步骤:
(1)检测视频中的镜头;
(2)以每个镜头为单位进行分析,如满足以下任何一个条件,则判断该镜头为广告镜头:
(A)镜头中包含的音频帧数目小于400,并且该镜头中包含的音乐帧比例大于20%;
或者,
(B)镜头中音乐帧所占比例大于说话声、背景声和无声中任何一个音频种类所占的比例;
(3)按照以下原则进行平滑处理操作:
(a)如果连续的广告镜头中有小于k个孤立的非广告镜头,则将这些非广告镜头镜头修改为广告镜头;
(b)如果连续的非广告镜头中有小于k个孤立的广告镜头,则将这些广告镜头修改为非广告镜头;
其中k为3;
(4)集合上述检测出的广告镜头,得到广告视频。
2、如权利要求1所述的一种广告视频检测的方法,其特征在于:步骤(2)中,运用声音分类器判断音频帧是否是音乐帧,采用基于支持向量机的分类模型进行音频分类。
3、如权利要求2所述的一种广告视频检测的方法,其特征在于:所述分类模型分为两部分:分类器模型训练和分类预测。
4、如权利要求1、2或3所述的一种广告视频检测的方法,其特征在于:音频帧的音频特征采用的是对数能量和梅尔倒频谱系数组成的13维特征向量。
5、如权利要求3所述的一种广告视频检测的方法,其特征在于:分类器模型训练的过程是:
1)选择训练样本;
2)提取每一个样本的对数能量和梅尔倒频谱系数组成的音频特征,并将所有这些特征写入一个特征文件中;
3)利用支持向量机生成分类器模型,分类以帧为单位,给每个音频帧赋值一个相应的类别,训练样本的类别标注也是以帧为单位,利用标注好的类别进行支持向量机模型训练,最终训练生成一个4类的分类器模型。
6、如权利要求5所述的一种广告视频检测的方法,其特征在于:所述训练样本包含下列4类:(1)音乐声;(2)说话声;(3)背景声;(4)无声。
7、如权利要求3、5或6所述的一种广告视频检测的方法,其特征在于:分类预测具体做法为:对于要进行分类的视频,先提取该视频对应音频的对数能量和梅尔倒频谱系数组成的音频特征,并利用支持向量机训练出来的分类器模型进行自动分类标注。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京大学;北京北大方正技术研究院有限公司,未经北大方正集团有限公司;北京大学;北京北大方正技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610080667.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:具有伸缩式门臂的自动门组件
- 下一篇:改进的黄色氧化铁颜料