[发明专利]音频文件的裁剪方法、装置及终端设备在审
申请号: | 201710142469.2 | 申请日: | 2017-03-10 |
公开(公告)号: | CN106935253A | 公开(公告)日: | 2017-07-07 |
发明(设计)人: | 周锋春 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G11B27/031 | 分类号: | G11B27/031 |
代理公司: | 北京市立方律师事务所11330 | 代理人: | 王增鑫 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频文件 裁剪 方法 装置 终端设备 | ||
1.一种音频文件的裁剪方法,其特征在于,包括:
确定出音频文件中的无效音频及其所在的文件片段;
对所述音频文件中无效音频所在的文件片段进行裁剪,生成裁剪后的音频文件。
2.根据权利要求1所述的方法,其特征在于,所述确定出音频文件中的无效音频及其所在的文件片段,包括:
当所述音频文件中每个时刻的音频符合下述至少一项时,确定出该时刻的音频为无效音频:特征值低于预设的空白音频阈值、频率与预设的噪声音频相匹配、音源方向与指定方向不一致;
进而确定出无效音频所在的文件片段。
3.根据权利要求2所述的方法,其特征在于,当所述音频文件中每个时刻的音频的特征值低于预设的空白音频阈值时,确定出该时刻的音频为无效音频,包括:
当所述音频文件中每个时刻采样得到的音频的数值低于预设的空白音频阈值时,确定出该时刻的音频为无效音频;
其中,所述音频文件中每个时刻的音频的特征值具体为该时刻采样得到的音频的数值。
4.根据权利要求3所述的方法,其特征在于,当所述音频文件中每个时刻采样得到的音频的数值低于预设的空白音频阈值时,确定出该时刻的音频为无效音频,包括:
当所述音频文件为用户方录音得到的录音文件时,将该录音文件中数值低于第一空白音频阈值的各时刻的音频,都确定为无效音频;或者
当所述音频文件为服务方提供的音乐文件时,将该音乐文件中数值低于第二空白音频阈值的各时刻的音频,都确定为无效音频;
其中,第一空白音频阈值高于第二空白音频阈值。
5.根据权利要求2所述的方法,其特征在于,当所述音频文件中每个时刻的音频的频率与预设的噪声音频相匹配时,确定出该时刻的音频为无效音频,包括:
当所述音频文件中多个时刻的音频的频率保持基本不变时,确定出该多个时刻的音频都为无效音频;
当所述音频文件中多个时刻的音频的频率的变化规律与已知噪声的变化规律相匹配时,确定出该多个时刻的音频都为无效音频。
6.根据权利要求2所述的方法,其特征在于,当所述音频文件中每个时刻的音频的音源方向与指定方向不一致时,确定出该时刻的音频为无效音频,包括:
当所述音频文件为多个音频采集设备采集指定方向的声音所得时,将该音频文件中与所述指定方向不一致的音源对应的音频,确定为无效音频。
7.根据权利要求1-6任一项所述的方法,其特征在于,对所述音频文件中无效音频所在的文件片段进行裁剪,生成裁剪后的音频文件,还包括:
根据预设的衔接时长,对所述音频文件中无效音频所在的每个文件片段的时长进行裁剪;
根据经过裁剪的所述音频文件的各文件片段,生成裁剪后的音频文件。
8.根据权利要求7所述的方法,其特征在于,根据源自所述音频文件的经过裁剪的各文件片段,生成裁剪后的音频文件,还包括:
当所述音频文件为多媒体文件中的音频流文件时,将经过裁剪的所述音频流文件的各文件片段,匹配到该多媒体文件的播放时间轴上。
9.一种音频文件的裁剪装置,其特征在于,包括:
无效音频确定模块,用于确定出音频文件中的无效音频及其所在的文件片段;
音频文件裁剪模块,用于对所述音频文件中无效音频所在的文件片段进行裁剪,生成裁剪后的音频文件。
10.一种终端设备,包括:
触敏显示器;
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:
确定出音频文件中的无效音频及其所在的文件片段;
对所述音频文件中无效音频所在的文件片段进行裁剪,生成裁剪后的音频文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710142469.2/1.html,转载请声明来源钻瓜专利网。