[发明专利]音频处理方法及装置在审
申请号: | 202110234594.2 | 申请日: | 2021-03-03 |
公开(公告)号: | CN113035207A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 王晓红;陈佳路;刘鲁鹏;元海明;李贝;夏龙 | 申请(专利权)人: | 北京猿力未来科技有限公司 |
主分类号: | G10L19/005 | 分类号: | G10L19/005;H04L29/06 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 刘晓楠 |
地址: | 100102 北京市朝阳区广顺南大*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 处理 方法 装置 | ||
1.一种音频处理方法,其特征在于,包括:
获取待处理音频;
对所述待处理音频进行预处理,获得所述待处理音频对应的全局频域帧序列;
根据所述全局频域帧序列构建所述待处理音频对应的音频特征集合,并将所述音频特征集合输入至音频处理模型进行处理获得局部频域帧序列;
基于所述局部频域帧序列和所述全局频域帧序列生成用于替换所述待处理音频的目标音频。
2.根据权利要求1所述的音频处理方法,其特征在于,所述对所述待处理音频进行预处理,获得所述待处理音频对应的全局频域帧序列,包括:
对所述待处理音频进行分帧处理,获得时域帧序列;
按照预设的变换策略对所述时域帧序列进行变换处理,获得所述全局频域帧序列。
3.根据权利要求2所述的音频处理方法,其特征在于,所述按照预设的变换策略对所述时域帧序列进行变换处理,获得所述全局频域帧序列,包括:
确定所述时域帧序列对应的时域信息,并在所述预设的变换策略中选择与所述时域信息对应的变换参数;
通过所述变换参数对所述时域帧序列进行变换处理,获得所述全局频域帧序列。
4.根据权利要求1所述的音频处理方法,其特征在于,所述根据所述全局频域帧序列构建所述待处理音频对应的音频特征集合,包括:
确定所述全局频域帧序列对应的频域信息,并基于所述频域信息确定所述全局频域帧序列的频域帧、分量以及复数;
基于所述频域帧、所述分量以及所述复数构建所述待处理音频对应的所述音频特征集合。
5.根据权利要求1至4任意一项所述的音频处理方法,其特征在于,所述将所述音频特征集合输入至音频处理模型进行处理获得局部频域帧序列,包括:
将所述音频特征集合输入至所述音频处理模型,通过所述音频处理模型中的卷积层对所述音频特征集合进行处理,获得中间音频特征集合;
基于所述音频处理模型中的预设参考幅值对所述中间音频特征集合进行调整,获得目标音频特征集合;
通过所述音频处理模型中的输出层对所述目标音频特征集合进行处理,获得所述音频处理模型输出的所述局部频域帧序列。
6.根据权利要求1所述的音频处理方法,其特征在于,所述基于所述局部频域帧序列和所述全局频域帧序列生成用于替换所述待处理音频的目标音频,包括:
基于所述局部频域帧序列对所述全局频域帧序列进行更新,获得目标全局频域帧序列;
根据所述目标全局频域帧序列生成用于替换所述待处理音频的所述目标音频。
7.根据权利要求6所述的音频处理方法,其特征在于,所述基于所述局部频域帧序列对所述全局频域帧序列进行更新,获得目标全局频域帧序列,包括:
在所述全局频域帧序列中确定与所述局部频域帧序列对应的初始局部频域帧序列;
根据所述局部频域帧序列对所述全局频域帧序列中的所述初始局部频域帧序列进行更新,获得所述目标全局频域帧序列。
8.根据权利要求7所述的音频处理方法,其特征在于,所述根据所述局部频域帧序列对所述全局频域帧序列中的所述初始局部频域帧序列进行更新,获得所述目标全局频域帧序列,包括:
根据所述初始局部频域帧序列在所述全局频域帧序列中确定固定频域帧序列;
将所述固定频域帧序列与所述局部频域帧序列进行拼接,获得所述目标全局频域帧序列。
9.根据权利要求6所述的音频处理方法,其特征在于,所述根据所述目标全局频域帧序列生成用于替换所述待处理音频的所述目标音频,包括:
对所述目标全局频域帧序列进行逆处理,获得目标全局时域帧序列;
根据所述目标全局时域帧序列生成用于替换所述待处理音频的目标音频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猿力未来科技有限公司,未经北京猿力未来科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110234594.2/1.html,转载请声明来源钻瓜专利网。