[发明专利]一种广告视频检测的方法有效
申请号: | 200610080667.2 | 申请日: | 2006-05-25 |
公开(公告)号: | CN101080028A | 公开(公告)日: | 2007-11-28 |
发明(设计)人: | 彭宇新;肖建国 | 申请(专利权)人: | 北大方正集团有限公司;北京大学;北京北大方正技术研究院有限公司 |
主分类号: | H04N17/02 | 分类号: | H04N17/02 |
代理公司: | 北京同达信恒知识产权代理有限公司 | 代理人: | 李欣 |
地址: | 100871北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 广告 视频 检测 方法 | ||
技术领域
本发明属于视频分析及检索技术领域,具体涉及一种广告视频检测的方法。
背景技术
随着人类视频信息的常年累积,如电视台视频节目的积累、网上数字视频的增加、家庭视频的增多,以及数字图书馆、视频点播、远程教学等大量的应用,视频信息已经出现爆炸性增长。为了有效地利用这些信息,视频分析与检索技术也就成为近年来计算机研究和应用的热点问题。
在众多的视频类型中,广告视频作为一种重要形式,伴随着我们的日常生活,具有非常重要的使用价值和商业价值。其中,如何从视频中自动检测出广告,则是广告视频研究和应用的关键问题。现有的广告视频检测方法,一般是从广告具有的图像特征出发来进行识别,这种方法因为仅仅利用了图像特征,因此存在检测错误或检测不全的问题。如1999年在ICMCS国际会议上发表的文献“AudiCom:a Video Analysis System for Auditing CommercialBroadcasts”(作者是J.M.Sanchez和X.Binefa),利用图像特征检测知道的或者注册过的广告,而音频特征没有被使用。
发明内容
针对现有技术的不足,本发明提出了同时利用广告视频具有的图像和音频特征,综合进行检测。本发明首先检测视频中的镜头,然后以镜头为单位,通过镜头中音频帧类型和数目的分析,识别广告镜头和非广告镜头,并通过平滑处理,最终检测出广告视频。试验结果证明了本发明的有效性,从而实现了从视频中自动检测广告的应用。
本发明的目的是这样实现的:
(1)检测视频中的镜头;
(2)以每个镜头为单位进行分析,如满足以下任何一个条件,则判断该镜头为广告镜头:
(A)镜头中包含的音频帧数目小于400,并且该镜头中包含的音乐帧比例大于20%;
或者,
(B)镜头中音乐帧所占比例大于除音乐声类以外的其它任何一个音频种类所占的比例;
(3)按照以下原则进行平滑处理操作:
(a)如果连续的广告镜头中有小于k个孤立的非广告镜头,则将这些非广告镜头修改为广告镜头;
(b)如果连续的非广告镜头中有小于k个孤立的广告镜头,则将这些广告镜头修改为非广告镜头;其中k为3;
(4)集合上述检测出的广告镜头,得到广告视频。
进一步,运用声音分类器判断音频帧是否是音乐帧,采用基于支持向量机的分类模型进行音频分类。
所述分类模型分为两部分:分类器模型训练和分类预测。
进一步,音频帧的音频特征采用的是对数能量和梅尔倒频谱系数组成的13维特征向量。
进一步,分类器模型训练的过程是:
1)选择训练样本;
2)提取每一个样本的对数能量和梅尔倒频谱系数组成的音频特征,并将所有这些特征写入一个特征文件中;
3)利用支持向量机生成分类器模型,分类以帧为单位,给每个音频帧赋值一个相应的类别,训练样本的类别标注也是以帧为单位,利用标注好的类别进行支持向量机模型训练,最终训练生成一个4类的分类器模型。
进一步,所述训练样本包含下列4类:(1)音乐声;(2)说话声;(3)背景声;(4)无声。
进一步,所述分类预测具体做法为:对于要进行分类的视频,先提取该视频对应音频的对数能量和梅尔倒频谱系数组成的音频特征,并利用支持向量机训练出来的分类器模型进行自动分类标注。
进一步,k的值为3。
本发明的效果在于:本发明能够有效实现从视频中检测出广告视频。
本发明之所以具有如此显著的技术效果,其原因在于:
现有的广告视频检测方法,一般是从广告具有的图像特征出发,来进行识别。这种方法因为仅仅利用了图像特征,因此存在检测错误或检测不全的问题。针对现有技术的不足,本发明提出了同时利用广告视频具有的图像和音频特征,综合进行检测。本发明首先检测视频中的镜头边界,然后以镜头为单位,通过镜头中音频帧类型和数目的分析,识别广告镜头和非广告镜头,并通过平滑处理,最终检测出广告视频。试验结果证明了本发明的有效性,从而实现了从视频中有效检测广告视频的应用。
附图说明
图1是本发明的流程示意图。
具体实施方式
下面结合具体实施例,对本发明作进一步详细的描述。
本发明广告视频检测的方法的流程图,如图1所示,包括以下步骤:
(1)检测视频中的镜头;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京大学;北京北大方正技术研究院有限公司,未经北大方正集团有限公司;北京大学;北京北大方正技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610080667.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有伸缩式门臂的自动门组件
- 下一篇:改进的黄色氧化铁颜料