[发明专利]混响抑制的处理方法和装置有效
申请号: | 201910090031.3 | 申请日: | 2019-01-30 |
公开(公告)号: | CN109801643B | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 张峰;沙露露;聂镭 | 申请(专利权)人: | 龙马智芯(珠海横琴)科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L15/06;G10L25/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 519031 广东省珠海市横琴新区环岛*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 混响 抑制 处理 方法 装置 | ||
1.一种混响抑制的处理方法,其特征在于,包括:
获取待处理的声音数据,其中,所述待处理的声音数据为包含混响的第一声音数据;
依据相似度矩阵对所述第一声音数据进行处理,得到初步混响抑制的第二声音数据,其中,所述相似度矩阵为预先训练得到,所述相似度矩阵是特定环境下的用于评估音频中混响分量大小的矩阵;
依据wavenet网络模型对所述第二声音数据进行处理,所述Wavenet网络模型为预先训练得到;
从所述Wavenet网络模型中获取输出的第三声音数据;
依据相似度矩阵对所述第一声音数据进行处理,得到初步混响抑制的第二声音数据包括:
根据所述相似度矩阵对所述第一声音数据进行加权处理,得到所述第一声音数据中混响分量的声音数据;
将所述第一声音数据减去所述混响分量的声音数据,得到所述初步混响抑制的第二声音数据;
在从所述Wavenet网络模型中获取输出的第三声音数据之后,所述方法还包括:对所述Wavenet网络模型中获取输出的所述第三声音数据进行平滑处理。
2.根据权利要求1所述的方法,其特征在于,在依据相似度矩阵对所述第一声音数据进行处理之前,所述方法还包括:
获取多组训练数据,其中,每组训练数据均为成对的声音数据,所述每组训练数据包括:包含混响的声音数据,以及与之对应的不含有混响的声音数据;
使用滑窗法计算每对滑窗中所述包含混响的声音数据与所述不含有混响的声音数据之间的相似度,以确定所述相似度矩阵。
3.根据权利要求1所述的方法,其特征在于,在依据wavenet网络模型对所述第二声音数据进行处理之前,所述方法还包括:
获取多组训练数据,其中,每组训练数据均为成对的声音数据,所述每组训练数据包括:包含混响的声音数据,以及与之对应的不含有混响的声音数据;
使用上述多组训练数据进行对所述wavenet网络模型进行学习训练,以确定所述wavenet网络模型中的参数数据。
4.根据权利要求2或3所述的方法,其特征在于,多组训练数据至少包括以下任意之一的特征:
每组所述训练数据中的声音数据的采样率为16KHz;
所述多组训练数据中的每段声音数据的平均时长为10s,且每段声音数据的时长标准差为1s;
所述多组训练数据中声音数据的总时长为20h。
5.根据权利要求4所述的方法,其特征在于,使用上述多组训练数据进行对所述wavenet网络模型进行学习训练包括:依据上述多组训练数据进行对所述wavenet网络模型使用随机梯度下降法进行学习训练。
6.一种混响抑制的处理装置,其特征在于,包括:
第一获取单元,用于获取待处理的声音数据,其中,所述待处理的声音数据为包含混响的第一声音数据;
第一处理单元,用于依据相似度矩阵对所述第一声音数据进行处理,得到初步混响抑制的第二声音数据,其中,所述相似度矩阵为预先训练得到,所述相似度矩阵是特定环境下的用于评估音频中混响分量大小的矩阵;
第二处理单元,用于依据wavenet网络模型对所述第二声音数据进行处理,其中,所述Wavenet网络模型为预先训练得到;
输出单元,用于从所述Wavenet网络模型中获取输出的第三声音数据;
所述第一处理单元包括:
第一处理模块,用于根据所述相似度矩阵对所述第一声音数据进行加权处理,得到所述第一声音数据中混响分量的声音数据;
第二处理模块,用于将所述第一声音数据减去所述混响分量的声音数据,得到所述初步混响抑制的第二声音数据
所述装置还包括:
第三处理单元,用于对所述Wavenet网络模型中获取输出的所述第三声音数据进行平滑处理。
7.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行权利要求1至5中任意一项所述的混响抑制的处理方法。
8.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至5中任意一项所述的混响抑制的处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于龙马智芯(珠海横琴)科技有限公司,未经龙马智芯(珠海横琴)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910090031.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:降采样方法及装置
- 下一篇:混合声音信号的分离方法、装置、电子设备和可读介质