[发明专利]视频文件的切分方法及装置在审
申请号: | 201410143826.3 | 申请日: | 2014-04-10 |
公开(公告)号: | CN103905742A | 公开(公告)日: | 2014-07-02 |
发明(设计)人: | 崔玉斌;宿玉文 | 申请(专利权)人: | 北京数码视讯科技股份有限公司 |
主分类号: | H04N5/262 | 分类号: | H04N5/262;H04N21/233;H04N21/234;H04N21/439;H04N21/44 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 吴贵明;张永明 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频文件 切分 方法 装置 | ||
技术领域
本发明涉及通信领域,具体而言,涉及一种视频文件的切分方法及装置。
背景技术
图1是根据相关技术的新闻节目大数据Map-Reduce并行处理流程的示意图。如图1所示,在Hadoop中的每个数据节点上运行Map作业,各自处理一路新闻电视节目。Map主要执行以下两种操作:
其一、是采用语音识别算法对电视新闻播音员的语音数据进行处理;
其二、是进行视频内容分析和视频切分输出新媒体数据。
其中,Map第一阶段的主要目的在于对视频段进行语音识别分析以获取语音关键词作为标签,并为新媒体内容搜索建立索引。而Map第二阶段的主要目的在于产生当今日益流行的三屏新媒体短视频内容。然后再由Reduce作业将新媒体内容进行分类聚合,从而适应于新媒体聚合门户应用。
然而,上述技术方案存在如下缺陷:相关技术中为了并行计算而简单切分文件会导致语音识别的准确率下降。另外,自动化切分新媒体内容缺乏紧密性、准确性和完整性。
发明内容
本发明提供了一种视频文件的切分方法及装置,以至少解决相关技术中为了并行计算而简单切分文件会导致语音识别的准确率下降的问题。
根据本发明的一个方面,提供了一种视频文件的切分方法。
根据本发明实施例的视频文件的切分方法包括:将通过声纹识别获取到的音频文件划分为N个时间长度相同的音频数据段,再根据各个音频数据段的内容相似度对相邻的多个音频数据段进行合并,生成M个音频数据单元,其中,M<N,N和M均为正整数;分别获取每个音频数据单元对应的视频图像帧所在的视频图像组(GoP),并对该GoP以及与该GoP前后相邻的两个GoP进行码流分析;根据码流分析结果对与音频文件同步播放的视频文件进行切分。
优选地,根据各个音频数据段的内容相似度对相邻的多个音频数据段进行合并,生成M个音频数据单元包括:按照预先设定的关键词类别分别对每个音频数据段中出现的多个关键词进行分类;对每种分类中的各个关键词的出现频率进行统计分析并在对每个关键词的出现频率进行降序排列后选取前X个关键词,其中,X为正整数;判断相邻的多个音频数据段中各自选取的前X个关键词的重复率是否超过预设阈值;如果是,则对相邻的多个音频数据段进行合并。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数码视讯科技股份有限公司,未经北京数码视讯科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410143826.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:延长井口的使用寿命的方法及装置
- 下一篇:模板支撑件的改进