[发明专利]一种场景切换点的检测方法及装置有效

申请号：	201410845412.5	申请日：	2014-12-31
公开（公告）号：	CN104469487B	公开（公告）日：	2019-02-12
发明（设计）人：	吴凯凯;卢学裕;付鹏;白雪;吴鑫;姚键;潘柏宇;卢述奇	申请（专利权）人：	优酷网络技术（北京）有限公司
主分类号：	H04N21/44	分类号：	H04N21/44;H04N21/439;H04N21/234;H04N21/233
代理公司：	北京林达刘知识产权代理事务所(普通合伙) 11277	代理人：	刘新宇
地址：	100080 北京市海淀区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	视频场景切换音频数据场景中音频数据工作效率视频处理音频信息检测标注
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种场景切换点的检测方法及装置，包括：获取第一视频；提取所述第一视频中音频数据作为第一音频数据；根据所述第一音频数据确定场景的切换位置。通过使用以上方法，可以根据视频中的具体音频信息来判断视频中场景的切换，避免了现有技术中依赖人工进行标注的复杂工作，提高了视频处理的工作效率。

技术领域

本发明涉及数字多媒体技术领域，特别是一种场景切换点的检测方法及装置。

背景技术

随着数字多媒体技术的快速发展，越来越多的多媒体技术应用到人们的工作和生活中。

在视频编辑领域，经常会接触到“关键帧”的概念，我们可以使用相关算法或工具处理得到某一视频中存在的所有关键帧。例如，在某个电视剧中，从5分30秒开始至10分15秒是一个在咖啡厅会谈的场景；而在10分16秒至12分30秒时是在汽车中对话的场景。因此，在10分16秒里包含一个关键帧，而此处正好是一个场景开始的位置。并且在该时间点后续的对话中，可能会频繁的切换镜头角度，导致相关的算法或工具判断出很多的关键帧，但这些关键帧都不是场景正确的结束位置。

由于在实际中一个场景会有很多个镜头切换，因此仅通过关键帧数据是无法比较准确的定位一个较完整的场景的开始或结束位置。现有的视频场景的标注方法是由人工浏览影片的方式确定不同场景的开始或结束位置。这对编辑人员的经验以及工作强度要求较高，且处理效率很低。

因此，如何提供一种可以对场景切换点进行自动检测的方法和装置是本发明需要解决的问题。

发明内容

针对现有技术的缺陷，本发明提供了一种场景切换点的检测方法及装置，解决了现有技术中依赖人工操作的问题，同时可以更加精确的判断出场景切换的位置点。

一种场景切换点的检测方法，包括：

获取第一视频；

提取所述第一视频中音频数据作为第一音频数据；

根据所述第一音频数据确定场景的切换位置。

优选地，所述提取所述第一视频中音频数据作为第一音频数据，具体为：

提取所述第一视频中的人声音频作为所述第一音频数据。

优选地，所述提取所述第一视频中音频数据作为第一音频数据，具体为：

提取所述第一视频中的背景音频作为所述第一音频数据。