[发明专利]一种场景切换点的检测方法及装置有效
申请号: | 201410845412.5 | 申请日: | 2014-12-31 |
公开(公告)号: | CN104469487B | 公开(公告)日: | 2019-02-12 |
发明(设计)人: | 吴凯凯;卢学裕;付鹏;白雪;吴鑫;姚键;潘柏宇;卢述奇 | 申请(专利权)人: | 优酷网络技术(北京)有限公司 |
主分类号: | H04N21/44 | 分类号: | H04N21/44;H04N21/439;H04N21/234;H04N21/233 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 场景切换 音频数据 场景 中音频数据 工作效率 视频处理 音频信息 检测 标注 | ||
本发明提供一种场景切换点的检测方法及装置,包括:获取第一视频;提取所述第一视频中音频数据作为第一音频数据;根据所述第一音频数据确定场景的切换位置。通过使用以上方法,可以根据视频中的具体音频信息来判断视频中场景的切换,避免了现有技术中依赖人工进行标注的复杂工作,提高了视频处理的工作效率。
技术领域
本发明涉及数字多媒体技术领域,特别是一种场景切换点的检测方法及装置。
背景技术
随着数字多媒体技术的快速发展,越来越多的多媒体技术应用到人们的工作和生活中。
在视频编辑领域,经常会接触到“关键帧”的概念,我们可以使用相关算法或工具处理得到某一视频中存在的所有关键帧。例如,在某个电视剧中,从5分30秒开始至10分15秒是一个在咖啡厅会谈的场景;而在10分16秒至12分30秒时是在汽车中对话的场景。因此,在10分16秒里包含一个关键帧,而此处正好是一个场景开始的位置。并且在该时间点后续的对话中,可能会频繁的切换镜头角度,导致相关的算法或工具判断出很多的关键帧,但这些关键帧都不是场景正确的结束位置。
由于在实际中一个场景会有很多个镜头切换,因此仅通过关键帧数据是无法比较准确的定位一个较完整的场景的开始或结束位置。现有的视频场景的标注方法是由人工浏览影片的方式确定不同场景的开始或结束位置。这对编辑人员的经验以及工作强度要求较高,且处理效率很低。
因此,如何提供一种可以对场景切换点进行自动检测的方法和装置是本发明需要解决的问题。
发明内容
针对现有技术的缺陷,本发明提供了一种场景切换点的检测方法及装置,解决了现有技术中依赖人工操作的问题,同时可以更加精确的判断出场景切换的位置点。
一种场景切换点的检测方法,包括:
获取第一视频;
提取所述第一视频中音频数据作为第一音频数据;
根据所述第一音频数据确定场景的切换位置。
优选地,所述提取所述第一视频中音频数据作为第一音频数据,具体为:
提取所述第一视频中的人声音频作为所述第一音频数据。
优选地,所述提取所述第一视频中音频数据作为第一音频数据,具体为:
提取所述第一视频中的背景音频作为所述第一音频数据。
优选地,所述根据所述第一音频数据确定场景的切换位置,具体为:
检测第一音频数据中的声波变化特征;
根据所述声波变化特征确定场景的切换位置。
在根据所述第一音频数据确定场景的切换位置之后,还包括:
获取预判位置信息;
根据所述预判位置信息修正所述场景的切换位置。
一种场景切换点的检测装置,包括:视频获取单元、第一音频提取单元和切换位置确定单元;
所述视频获取单元,用于获取第一视频;
所述第一音频提取单元,用于提取所述第一视频中音频数据作为第一音频数据;
所述切换位置确定单元,用于根据所述第一音频数据确定场景的切换位置。
优选地,所述第一音频提取单元,包括:人声音频提取子单元;
所述人声音频提取子单元,用于提取所述第一视频中的人声音频作为所述第一音频数据。
优选地,所述第一音频提取单元,包括:背景音频提取子单元;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于优酷网络技术(北京)有限公司,未经优酷网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410845412.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种发动机模型安装推力修正方法
- 下一篇:用于压控振荡器的系统和方法