[发明专利]视频文件的切分方法及装置在审

专利信息
申请号: 201410143826.3 申请日: 2014-04-10
公开(公告)号: CN103905742A 公开(公告)日: 2014-07-02
发明(设计)人: 崔玉斌;宿玉文 申请(专利权)人: 北京数码视讯科技股份有限公司
主分类号: H04N5/262 分类号: H04N5/262;H04N21/233;H04N21/234;H04N21/439;H04N21/44
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 吴贵明;张永明
地址: 100085 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 视频文件 切分 方法 装置
【说明书】:

技术领域

发明涉及通信领域,具体而言,涉及一种视频文件的切分方法及装置。

背景技术

图1是根据相关技术的新闻节目大数据Map-Reduce并行处理流程的示意图。如图1所示,在Hadoop中的每个数据节点上运行Map作业,各自处理一路新闻电视节目。Map主要执行以下两种操作:

其一、是采用语音识别算法对电视新闻播音员的语音数据进行处理;

其二、是进行视频内容分析和视频切分输出新媒体数据。

其中,Map第一阶段的主要目的在于对视频段进行语音识别分析以获取语音关键词作为标签,并为新媒体内容搜索建立索引。而Map第二阶段的主要目的在于产生当今日益流行的三屏新媒体短视频内容。然后再由Reduce作业将新媒体内容进行分类聚合,从而适应于新媒体聚合门户应用。

然而,上述技术方案存在如下缺陷:相关技术中为了并行计算而简单切分文件会导致语音识别的准确率下降。另外,自动化切分新媒体内容缺乏紧密性、准确性和完整性。

发明内容

本发明提供了一种视频文件的切分方法及装置,以至少解决相关技术中为了并行计算而简单切分文件会导致语音识别的准确率下降的问题。

根据本发明的一个方面,提供了一种视频文件的切分方法。

根据本发明实施例的视频文件的切分方法包括:将通过声纹识别获取到的音频文件划分为N个时间长度相同的音频数据段,再根据各个音频数据段的内容相似度对相邻的多个音频数据段进行合并,生成M个音频数据单元,其中,M<N,N和M均为正整数;分别获取每个音频数据单元对应的视频图像帧所在的视频图像组(GoP),并对该GoP以及与该GoP前后相邻的两个GoP进行码流分析;根据码流分析结果对与音频文件同步播放的视频文件进行切分。

优选地,根据各个音频数据段的内容相似度对相邻的多个音频数据段进行合并,生成M个音频数据单元包括:按照预先设定的关键词类别分别对每个音频数据段中出现的多个关键词进行分类;对每种分类中的各个关键词的出现频率进行统计分析并在对每个关键词的出现频率进行降序排列后选取前X个关键词,其中,X为正整数;判断相邻的多个音频数据段中各自选取的前X个关键词的重复率是否超过预设阈值;如果是,则对相邻的多个音频数据段进行合并。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数码视讯科技股份有限公司,未经北京数码视讯科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410143826.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top