[发明专利]一种基于内容的视频分段方法有效

专利信息
申请号: 201610066554.0 申请日: 2016-01-29
公开(公告)号: CN105744356B 公开(公告)日: 2019-03-12
发明(设计)人: 肖俊;陈刘策 申请(专利权)人: 杭州观通科技有限公司
主分类号: H04N21/44 分类号: H04N21/44;H04N21/845
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 郑海峰
地址: 310052 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 内容 视频 分段 方法
【说明书】:

发明公开了一种基于内容的视频分段方法。首先,利用字幕文件得到视频中的每一段话的内容和时间点,再利用每两段话之间的时间间隔,将贴近的话组合在一起作为一个较大的自然段,然后,对这个大的自然段进行分词处理,并对利用词和词之间的相似性,得到句子和句子之间的相似性,将相似性比较大的句子组合在一起作为一个自然段,然后根据对应的时间信息可以得到初步的视频分段位置。接着基于图像对视频进行镜头提取,再结合之前得到的分段位置,找到最终的准确分段位置。

技术领域

本发明设计视频处理技术领域,自然语言处理技术,特别涉及视频分段方法。

背景技术

科教视频是一种常见的视频类型,随着网络时代的来临,用户在观看科教视频的载体也从电视逐渐向电脑和网络变化。而在观看视频的时候,观众往往会选择快速跳跃,跳过不想观看的部分,观看他们感兴趣的内容。

而在跳跃的过程中,用户很难准确地调整至准确的想观看的位置,都需要经过多次调整才能到达用户心目中满意的位置,这个过程十分影响观看体验性,所以将视频进行分段,用户在选择跳过本段内容时,可以通过视频本身给出的分段信息,准确快速地定位至下一段内容的开始处,而不用用户自己慢慢调整,这对视频网站来说,无疑是大大增加了其竞争力。

目前视频自动分段的方案大都是使用基于场景检测的方法,将相同场景的视频划分为一段,将场景改变的帧设定为某一段的起点,但是一个视频往往会有大量的场景讲述同一件事,基于场景的分段会造成分段频率过高,甚至出现在几秒钟之内划分了数段的特殊情况出现,这都是不科学的分段方法。

而具有标准的字幕文件的视频,可以从字幕的时间轴和具体内容出发,从自然语言的角度出发,分析出各段话之间的相似度,利用相似度进行分段,再利用这个分段信息,结合科教视频中比较清洗的场景上的变换,得到准确的分段信息。

发明内容

本发明的目的是为了解决科教视频的自动分段问题,提供了一种基于内容的自动分段方法。其特征在于包括以下步骤:

由字幕文件提取出视频中的对话流S={s1,s2,s3,…,sn},每一段对话的开始时间B={b1,b2,b3,…,bn},每一段对话的结束时间E={e1,e2,e3,…,en}。

对于所有的相邻对话si,si-1,设定一个阈值λ,当bi-ei-1<λ时,则令si,si-1归为同一段,从而将对话流S划分为m段,其中第i段由从第k句话开始,一共由l段连续的对话组成,即Si={sk,sk+1,sk+2,…sk+l}。

使用ICTCLAS分词工具对每一句话sk进行分词,去除非实词后得到sk的词列表Ck={ck1,ck2,ck3,…,ckh}。

通过以下公式求得任何两个句子sx和sy之间的相似度:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州观通科技有限公司,未经杭州观通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610066554.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top