[发明专利]音频文件的裁剪方法、装置及终端设备在审

专利信息
申请号: 201710142469.2 申请日: 2017-03-10
公开(公告)号: CN106935253A 公开(公告)日: 2017-07-07
发明(设计)人: 周锋春 申请(专利权)人: 北京奇虎科技有限公司
主分类号: G11B27/031 分类号: G11B27/031
代理公司: 北京市立方律师事务所11330 代理人: 王增鑫
地址: 100088 北京市西城区新*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 音频文件 裁剪 方法 装置 终端设备
【说明书】:

技术领域

发明涉及终端技术领域,更具体地,涉及一种音频文件的裁剪方法、装置及终端设备。

背景技术

随着科技的进步和社会的发展,台式电脑、笔记本电脑、智能手机和平板电脑等终端设备已经广泛普及。

用户的终端设备中通常存储有大量的音频文件。音频文件包括音乐文件、和录音文件等。用户可以通过终端设备自带或外接的音频采集设备,例如麦克风,采集声音,生成录音文件,用于即时通讯中的语音聊天、进行音视频直播或自行制作音视频节目等。

由于对于从事媒体行业的用户而言,很可能需要存储大量的音频文件。

然而,本发明的发明人发现,相当数量的音频文件尤其是录音文件,比较臃肿,占用了终端设备大量的存储空间。

发明内容

鉴于上述问题,本发明提出了一种音频文件的裁剪方法、装置及终端设备,以通过自动裁剪音频文件中的无效音频,减小音频文件占用的存储空间,提升终端设备存储空间的利用效率水平,提升音频文件的播放效率。

第一方面,本发明实施例中提供了一种音频文件的裁剪方法,包括:

确定出音频文件中的无效音频及其所在的文件片段;

对音频文件中无效音频所在的文件片段进行裁剪,生成裁剪后的音频文件。

结合第一方面,本发明实施例在第一方面的第一种实现方式中,当音频文件中每个时刻的音频符合下述至少一项时,确定出该时刻的音频为无效音频:特征值低于预设的空白音频阈值、频率与预设的噪声音频相匹配、音源方向与指定方向不一致;进而确定出无效音频所在的文件片段。

结合第一方面的第一种实现方式,在第一方面的第二种实现方式中,当音频文件中每个时刻采样得到的音频的数值低于预设的空白音频阈值时,确定出该时刻的音频为无效音频;其中,音频文件中每个时刻的音频的特征值具体为该时刻采样得到的音频的数值。

结合第一方面的第二种实现方式,在第一方面的第三种实现方式中,当音频文件为用户方录音得到的录音文件时,将该录音文件中数值低于第一空白音频阈值的各时刻的音频,都确定为无效音频;或者,当音频文件为服务方提供的音乐文件时,将该音乐文件中数值低于第二空白音频阈值的各时刻的音频,都确定为无效音频;其中,第一空白音频阈值高于第二空白音频阈值。

结合第一方面的第一种实现方式,在第一方面的第四种实现方式中,当音频文件中多个时刻的音频的频率保持基本不变时,确定出该多个时刻的音频都为无效音频;当音频文件中多个时刻的音频的频率的变化规律与已知噪声的变化规律相匹配时,确定出该多个时刻的音频都为无效音频。

结合第一方面的第一种实现方式,在第一方面的第五种实现方式中,当音频文件为多个音频采集设备采集指定方向的声音所得时,将该音频文件中与指定方向不一致的音源对应的音频,确定为无效音频。

结合第一方面或第一方面的第一至五种实现方式中任意一种实现方式,在第一方面的第六种实现方式中,根据预设的衔接时长,对音频文件中无效音频所在的每个文件片段的时长进行裁剪;根据经过裁剪的音频文件的各文件片段,生成裁剪后的音频文件。

结合第一方面的第六种实现方式,在第一方面的第七种实现方式中,当音频文件为多媒体文件中的音频流文件时,将经过裁剪的音频流文件的各文件片段,匹配到该多媒体文件的播放时间轴上。

第二方面,本发明实施例提供了一种音频文件的裁剪装置,该音频文件的裁剪装置具有实现上述第一方面中音频文件的裁剪方法行为的功能。功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中,音频文件的裁剪装置的结构中包括:

无效音频确定模块,用于确定出音频文件中的无效音频及其所在的文件片段;

音频文件裁剪模块,用于对音频文件中无效音频所在的文件片段进行裁剪,生成裁剪后的音频文件。

结合第二方面,在第二方面的第一种实现方式中,无效音频确定模块具体用于当音频文件中每个时刻的音频符合下述至少一项时,确定出该时刻的音频为无效音频:特征值低于预设的空白音频阈值、频率与预设的噪声音频相匹配、音源方向与指定方向不一致;进而确定出无效音频所在的文件片段。

结合第二方面的第一种实现方式,在第二方面的第二种实现方式中,无效音频确定模块具体用于当音频文件中每个时刻采样得到的音频的数值低于预设的空白音频阈值时,确定出该时刻的音频为无效音频;其中,音频文件中每个时刻的音频的特征值具体为该时刻采样得到的音频的数值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710142469.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top