[发明专利]混响抑制的处理方法和装置有效
申请号: | 201910090031.3 | 申请日: | 2019-01-30 |
公开(公告)号: | CN109801643B | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 张峰;沙露露;聂镭 | 申请(专利权)人: | 龙马智芯(珠海横琴)科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L15/06;G10L25/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 519031 广东省珠海市横琴新区环岛*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 混响 抑制 处理 方法 装置 | ||
本申请公开了一种混响抑制的处理方法和装置。该方法包括:获取待处理的声音数据,其中,所述待处理的声音数据为包含混响的第一声音数据;依据相似度矩阵对所述第一声音数据进行处理,得到初步混响抑制的第二声音数据,其中,所述相似度矩阵为预先训练得到;依据Wavenet网络模型对所述第二声音数据进行处理,其中,所述Wavenet网络模型为预先训练得到;从所述Wavenet网络模型中获取输出的第三声音数据。通过本申请,解决了相关技术中混响抑制算法的准确性较低、应用场景局限的问题。
技术领域
本申请涉及混响处理领域,具体而言,涉及一种混响抑制的处理方法和装置。
背景技术
声波在室内传播时,要被墙壁、天花板、地板等障碍物反射,每反射一次都要被障碍物吸收一些。这样,当声源停止发声后,声波在室内要经过多次反射和吸收,最后才消失,我们就感觉到声源停止发声后还有若干个声波混合持续一段时间(室内声源停止发声后仍然存在的声延续现象),这种现象叫做混响。
在相对封闭的室内空间,当在麦克风与音源的距离较远的场合,如使用免提电话、助听器、电话会议,或者在录制声音时,混响的存在使声音混淆不清、难于分辩,导致音质下降,就需要对混响进行消除/抑制。混响降低了语音清晰度,也给语音识别带来了很大的难度。
现有技术中主要采用传统方法对混响进行抑制,按照所用技术可以分为以下三种:基于波束形成、基于逆滤波、基于语音增强的混响抑制方法。其中,波束形成的混响抑制方法易实现,但不能应用于变化的声学环境;基于逆滤波技术的混响抑制方法目前来说还难以实现;基于语音增强的混响抑制方法,是单麦克风常用的方法,但其不能精确的提取出纯净语音。
针对上述相关技术中混响抑制算法的准确性较低、应用场景局限的问题,目前尚未提出有效的解决方案。
发明内容
本申请提供一种混响抑制的处理方法和装置,以解决相关技术中混响抑制算法的准确性较低、应用场景局限的问题。
根据本申请的一个方面,提供了一种混响抑制的处理方法。该方法包括:获取待处理的声音数据,其中,所述待处理的声音数据为包含混响的第一声音数据;依据相似度矩阵对所述第一声音数据进行处理,得到初步混响抑制的第二声音数据,其中,所述相似度矩阵为预先训练得到;依据Wavenet网络模型对所述第二声音数据进行处理,其中,所述Wavenet网络模型为预先训练得到;从所述Wavenet网络模型中获取输出的第三声音数据。
可选的,依据相似度矩阵对所述第一声音数据进行处理,得到初步混响抑制的第二声音数据包括:根据所述相似度矩阵对所述第一声音数据进行加权处理,得到第一声音数据中混响分量的声音数据;将所述第一声音数据减去所述混响分量的声音数据,得到所述初步混响抑制的第二声音数据。
可选的,在依据相似度矩阵对所述第一声音数据进行处理之前,所述方法还包括:获取多组训练数据,其中,每组训练数据均为成对的声音数据,所述每组训练数据包括:包含混响的声音数据,以及与之对应的不含有混响的声音数据;使用滑窗法计算每对滑窗中所述包含混响的声音数据与所述不含有混响的声音数据之间的相似度,以确定所述相似度矩阵。
可选的,在依据Wavenet网络模型对所述第二声音数据进行处理之前,所述方法还包括:获取多组训练数据,其中,每组训练数据均为成对的声音数据,所述每组训练数据包括:包含混响的声音数据,以及与之对应的不含有混响的声音数据;使用上述多组训练数据进行对所述Wavenet网络模型进行学习训练,以确定所述Wavenet网络模型中的参数数据。
可选的,多组训练数据至少包括以下任意之一的特征:每组所述训练数据中的声音数据的采样率为16KHz;所述多组训练数据中的每段声音数据的平均时长为10s,且每段声音数据的时长标准差为1s;所述多组训练数据中声音数据的总时长为20h。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于龙马智芯(珠海横琴)科技有限公司,未经龙马智芯(珠海横琴)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910090031.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:降采样方法及装置
- 下一篇:混合声音信号的分离方法、装置、电子设备和可读介质