[发明专利]一种场景切换点的检测方法及装置有效
申请号: | 201410845412.5 | 申请日: | 2014-12-31 |
公开(公告)号: | CN104469487B | 公开(公告)日: | 2019-02-12 |
发明(设计)人: | 吴凯凯;卢学裕;付鹏;白雪;吴鑫;姚键;潘柏宇;卢述奇 | 申请(专利权)人: | 优酷网络技术(北京)有限公司 |
主分类号: | H04N21/44 | 分类号: | H04N21/44;H04N21/439;H04N21/234;H04N21/233 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 场景切换 音频数据 场景 中音频数据 工作效率 视频处理 音频信息 检测 标注 | ||
1.一种场景切换点的检测方法,其特征在于,包括:
获取第一视频;
提取所述第一视频中的音频数据作为第一音频数据;以及
根据所述第一音频数据确定场景的切换位置;
其中,所述提取所述第一视频中的音频数据作为第一音频数据,具体为:
提取所述第一视频中的人声音频,对人声音频波段进行加强,并对其他波段进行抑制,并且,提取所述第一视频中的背景音频,对人声音频波段进行抑制或去除,从而将提取出的人声音频和背景音频作为所述第一音频数据;
其中,所述根据所述第一音频数据确定场景的切换位置,具体为:
检测所述人声音频的中的声波变化特征;
检测所述背景音频中的声波变化特征;以及
根据所述人声音频中的声波变化特征以及所述背景音频中的声波变化特征确定场景的切换位置,在所述第一视频中的一个时间位置上的所述人声音频和所述背景音频都发生了变化的情况下,将该一个时间位置确定为场景的切换位置。
2.根据权利要求1所述的方法,其特征在于,在根据所述第一音频数据确定场景的切换位置之后,还包括:
获取预判位置信息;
根据所述预判位置信息修正所述场景的切换位置。
3.一种场景切换点的检测装置,其特征在于,包括:视频获取单元、第一音频提取单元和切换位置确定单元;
其中,所述视频获取单元,用于获取第一视频;
所述第一音频提取单元,用于提取所述第一视频中的音频数据作为第一音频数据;
所述切换位置确定单元,用于根据所述第一音频数据确定场景的切换位置;
其中,所述第一音频提取单元提取所述第一视频中的人声音频和背景音频作为所述第一音频数据,其包括:人声音频提取子单元和背景音频提取子单元;
所述人声音频提取子单元,用于提取所述第一视频中的人声音频,对人声音频波段进行加强,并对其他波段进行抑制;
所述背景音频提取子单元,用于提取所述第一视频中的背景音频,对人声音频波段进行抑制或去除;
其中,所述切换位置确定单元,包括:声音检测子单元和特征判定子单元;
所述声音检测子单元,用于检测所述人声音频中的声波变化特征,以及检测所述背景音频中的声波变化特征;
所述特征判定子单元,用于根据所述人声音频中的声波变化特征以及所述背景音频中的声波变化特征确定场景的切换位置,在所述第一视频中的一个时间位置上的所述人声音频和所述背景音频都发生了变化的情况下,将该一个时间位置确定为场景的切换位置。
4.根据权利要求3所述的装置,其特征在于,还包括:预判信息修正单元;
所述预判信息修正单元,用于获取预判位置信息,根据所述预判位置信息修正所述场景的切换位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于优酷网络技术(北京)有限公司,未经优酷网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410845412.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种发动机模型安装推力修正方法
- 下一篇:用于压控振荡器的系统和方法