[发明专利]语音增强方法、装置、设备及可读存储介质在审
申请号: | 202211043039.2 | 申请日: | 2022-08-29 |
公开(公告)号: | CN115410588A | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 刘卓;付中华 | 申请(专利权)人: | 西安讯飞超脑信息科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L21/0232 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 侯珊 |
地址: | 710000 陕西省西安市高新区西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 增强 方法 装置 设备 可读 存储 介质 | ||
本申请公开了一种语音增强方法、装置、设备及可读存储介质。先基于当前声学场景确定前置固定波束滤波器组;在获取麦克风阵列在声学场景采集的原始多通道音频信号之后,先利用前置固定波束滤波器组对原始多通道音频信号进行波束形成处理,得到波束形成信号,再基于前置固定波束滤波器组,以及波束形成信号,计算后置滤波器的增益系数,使得计算得到的后置滤波器的增益系数误差较小,最后再利用后置滤波器的增益系数,对波束形成信号进行增强处理,得到增强后的语音信号,能够提升语音增强效果。
技术领域
本申请涉及音频处理技术领域,更具体的说,是涉及一种语音增强方法、 装置、设备及可读存储介质。
背景技术
麦克风阵列被广泛应用于声学前端的语音增强任务,基于麦克风阵列的 语音增强技术包括波束形成(固定波束形成、自适应波束形成)。通常基于 加性信号的相干函数矩阵模型,认为实际声学环境由三种理想声场构成,即 自由场、扩散场、空间白噪声场;而噪声是点声源、扩散噪声和空间白噪声 的线性叠加,而波束形成只能够抑制与目标声源方向不同的相干噪声源,其 降噪能力是有限的,并不能达到较好的语音增强效果,为了提高波束形成后 的音频质量,可以采用后滤波方案实现语音增强。
目前,常用的后滤波方案有MCMF(Multi-Channel Wiener Filter,多通道 维纳滤波器)、全局优化LSPF(Least-Squares Post Filter,最小二乘后置滤波 器)等,这些后滤波方案均基于麦克风阵列拾取的原始多通道音频信号计算 后置滤波器的增益系数,后置滤波器的增益系数容易出现误差,影响语音增 强效果。
因此,如何提供一种语音增强方法,以提升语音增强效果,成为本领域 技术人员亟待解决的技术问题。
发明内容
鉴于上述问题,本申请提出了一种语音增强方法、装置、设备及可读存 储介质。具体方案如下:
一种语音增强方法,所述方法包括:
基于当前声学场景确定前置固定波束滤波器组;
获取麦克风阵列在所述声学场景采集的原始多通道音频信号;
利用所述前置固定波束滤波器组对所述原始多通道音频信号进行波束形 成处理,得到波束形成信号;
基于所述前置固定波束滤波器组,以及所述波束形成信号,计算后置滤 波器的增益系数;
利用所述后置滤波器的增益系数,对所述波束形成信号进行增强处理, 得到增强后的语音信号。
可选地,所述基于当前声学场景确定前置固定波束滤波器组,包括:
基于所述声学场景,确定所述前置固定波束滤波器的波束模式、所述前 置固定波束滤波器组的波束数量,以及,所述前置固定波束滤波器组的波束 空间排布和主瓣指向;
基于所述前置固定波束滤波器的波束模式、所述前置固定波束滤波器组 的波束数量,以及,所述前置固定波束滤波器组的波束空间排布和主瓣指向, 确定所述前置固定波束滤波器组。
可选地,基于所述声学场景,确定所述前置固定波束滤波器组的波束数 量,包括:
根据所述声学场景包含的声源个数,确定相干函数矩阵方程组的未知量 个数;
根据所述函数矩阵方程组的未知量个数,确定所述前置固定波束滤波器 组的波束数量。
可选地,所述基于所述前置固定波束滤波器组,以及所述波束形成信号, 计算后置滤波器的增益系数,包括:
获取所述前置固定波束滤波器组的波束空间排布和主瓣指向、所述前置 固定波束滤波器组的系数矩阵;
确定所述波束形成信号的自协方差矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安讯飞超脑信息科技有限公司,未经西安讯飞超脑信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211043039.2/2.html,转载请声明来源钻瓜专利网。