[发明专利]音频信号处理方法及装置、存储介质在审
申请号: | 202110582749.1 | 申请日: | 2021-05-26 |
公开(公告)号: | CN113362847A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 侯海宁 | 申请(专利权)人: | 北京小米移动软件有限公司;北京小米松果电子有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/0216 |
代理公司: | 北京善任知识产权代理有限公司 11650 | 代理人: | 张振伟 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 处理 方法 装置 存储 介质 | ||
本公开是关于一种音频信号处理方法及装置、存储介质。该方法包括:获取至少两个麦克风分别对至少两个声源所采集的原始带噪信号;对所述至少两个麦克风各自的原始带噪信号进行声源分离,得到所述至少两个声源各自的频域估计信号;基于所述至少两个声源各自的频域估计信号,确定每个所述声源分别在所述至少两个麦克风的观测估计信号;基于所述至少两个声源对应的所述观测估计信号,确定每个声源的增强输出信号;根据滤波处理后的所述每个声源的增强输出信号,确定所述至少两个声源各自发出的音频信号。通过本公开实施例的方案,能够降低干扰,提升音频信号的语音质量。
技术领域
本公开涉及信号处理领域,尤其涉及一种音频信号处理方法及装置、存储介质。
背景技术
相关技术中,智能产品设备拾音多采用麦克风阵列,应用麦克风波束形成技术提高语音信号处理质量,以提高真实环境下的语音识别率。但多个麦克风的波束形成技术对麦克风位置误差敏感,性能影响较大,另外麦克风个数增多了也会导致产品成本升高。
因此,目前越来越多的智能产品设备只配置两个麦克风;两个麦克风常采用完全不同于多个麦克风波束形成技术的盲源分离技术对语音进行增强。然而,进行盲源分离后的语音信号往往还带有噪声残留,造成了信噪比偏低的问题。
发明内容
本公开提供一种音频信号处理方法及装置、存储介质。
根据本公开实施例的第一方面,提供一种音频信号处理方法,包括:
获取至少两个麦克风分别对至少两个声源所采集的原始带噪信号;
对所述至少两个麦克风各自的原始带噪信号进行声源分离,得到所述至少两个声源各自的频域估计信号;
基于所述至少两个声源各自的频域估计信号,确定每个所述声源分别在所述至少两个麦克风的观测估计信号;
基于所述至少两个声源对应的所述观测估计信号,确定每个声源的增强输出信号;
根据滤波处理后的所述每个声源的增强输出信号,确定所述至少两个声源各自发出的音频信号。
在一些实施例中,所述对所述至少两个麦克风各自的原始带噪信号进行声源分离,得到所述至少两个声源各自的频域估计信号,包括:
利用去模糊处理后的每一帧信号的分离矩阵对所述原始带噪信号进行声源分离,得到所述至少两个声源各自的频域估计信号;其中,所述频域估计信号携带有所述声源发出的所述音频信号的相位信息。
在一些实施例中,所述方法还包括:
利用所述分离矩阵和所述分离矩阵的逆矩阵,确定所述模糊处理后的分离矩阵。
在一些实施例中,所述方法还包括:
在当前帧不是第一帧时,基于当前帧的前一帧的分离矩阵与当前帧的原始带噪信号,确定当前帧的分离矩阵;或
在当前帧是第一帧时,基于预定的单位矩阵与当前帧的原始带噪信号,确定当前帧的分离矩阵。
在一些实施例中,所述观测估计信号携带有所述声源发出的所述音频信号的相位信息;所述基于所述至少两个声源对应的所述观测估计信号,确定每个声源的增强输出信号,包括:
根据所述观测估计信号,确定所述至少两个声源的估计坐标信息;
根据所述估计坐标信息和所述至少两个麦克风的坐标信息,确定所述至少两个声源到所述至少两个麦克风的时延差;
根据所述时延差,确定每个声源的所述增强输出信号。
在一些实施例中,所述根据所述估计坐标信息和所述至少两个麦克风的坐标信息,确定所述至少两个声源到所述至少两个麦克风的时延差,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司;北京小米松果电子有限公司,未经北京小米移动软件有限公司;北京小米松果电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110582749.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种农产品用便携式农药检测仪器
- 下一篇:一种无人值守的固废处理系统