[发明专利]语音增强方法、装置、设备及可读存储介质在审

申请号：	202211043039.2	申请日：	2022-08-29
公开（公告）号：	CN115410588A	公开（公告）日：	2022-11-29
发明（设计）人：	刘卓;付中华	申请（专利权）人：	西安讯飞超脑信息科技有限公司
主分类号：	G10L21/0208	分类号：	G10L21/0208;G10L21/0216;G10L21/0232
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	侯珊
地址：	710000 陕西省西安市高新区西***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音增强方法装置设备可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种语音增强方法、装置、设备及可读存储介质。先基于当前声学场景确定前置固定波束滤波器组；在获取麦克风阵列在声学场景采集的原始多通道音频信号之后，先利用前置固定波束滤波器组对原始多通道音频信号进行波束形成处理，得到波束形成信号，再基于前置固定波束滤波器组，以及波束形成信号，计算后置滤波器的增益系数，使得计算得到的后置滤波器的增益系数误差较小，最后再利用后置滤波器的增益系数，对波束形成信号进行增强处理，得到增强后的语音信号，能够提升语音增强效果。

技术领域

本申请涉及音频处理技术领域，更具体的说，是涉及一种语音增强方法、装置、设备及可读存储介质。

背景技术

麦克风阵列被广泛应用于声学前端的语音增强任务，基于麦克风阵列的语音增强技术包括波束形成(固定波束形成、自适应波束形成)。通常基于加性信号的相干函数矩阵模型，认为实际声学环境由三种理想声场构成，即自由场、扩散场、空间白噪声场；而噪声是点声源、扩散噪声和空间白噪声的线性叠加，而波束形成只能够抑制与目标声源方向不同的相干噪声源，其降噪能力是有限的，并不能达到较好的语音增强效果，为了提高波束形成后的音频质量，可以采用后滤波方案实现语音增强。

目前，常用的后滤波方案有MCMF(Multi-Channel Wiener Filter，多通道维纳滤波器)、全局优化LSPF(Least-Squares Post Filter，最小二乘后置滤波器)等，这些后滤波方案均基于麦克风阵列拾取的原始多通道音频信号计算后置滤波器的增益系数，后置滤波器的增益系数容易出现误差，影响语音增强效果。

因此，如何提供一种语音增强方法，以提升语音增强效果，成为本领域技术人员亟待解决的技术问题。

发明内容

鉴于上述问题，本申请提出了一种语音增强方法、装置、设备及可读存储介质。具体方案如下：

一种语音增强方法，所述方法包括：

基于当前声学场景确定前置固定波束滤波器组；

获取麦克风阵列在所述声学场景采集的原始多通道音频信号；

利用所述前置固定波束滤波器组对所述原始多通道音频信号进行波束形成处理，得到波束形成信号；

基于所述前置固定波束滤波器组，以及所述波束形成信号，计算后置滤波器的增益系数；

利用所述后置滤波器的增益系数，对所述波束形成信号进行增强处理，得到增强后的语音信号。

可选地，所述基于当前声学场景确定前置固定波束滤波器组，包括：

基于所述声学场景，确定所述前置固定波束滤波器的波束模式、所述前置固定波束滤波器组的波束数量，以及，所述前置固定波束滤波器组的波束空间排布和主瓣指向；

基于所述前置固定波束滤波器的波束模式、所述前置固定波束滤波器组的波束数量，以及，所述前置固定波束滤波器组的波束空间排布和主瓣指向，确定所述前置固定波束滤波器组。