[发明专利]基于统计模型的麦克风阵列语音增强方法有效
申请号: | 201711201341.5 | 申请日: | 2017-11-23 |
公开(公告)号: | CN107993670B | 公开(公告)日: | 2021-01-19 |
发明(设计)人: | 张军;邓舒夏;宁更新;冯义志;季飞 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L19/26;G10L21/0216;G10L21/0232;G10L21/0272 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍 |
地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 统计 模型 麦克风 阵列 语音 增强 方法 | ||
1.基于统计模型的麦克风阵列语音增强方法,其特征在于采用以下步骤对输入的语音信号进行增强:
步骤1:使用干净语音库建立用于语音帧分类的干净语音模型,并计算出对应于每个分类的干净语音线性频谱模型;所述干净语音库中的语音使用单麦克风进行采集;
步骤2:将麦克风阵列接收的信号分为两条支路,主支路采用GSC的固定波束形成器对期望方向的信号进行增强,得到初步增强的语音yc,辅助支路通过GSC的阻塞矩阵和自适应抵消器后,得到噪声分量yn;
步骤3:从辅助支路的信号中估计噪声模型及噪声的线性频谱模型;
步骤4:对yc分帧,并利用噪声模型和干净语音模型对每帧语音进行分类;
步骤5:根据步骤4的分类结果,利用干净语音线性频谱模型和噪声的线性频谱模型构造最佳滤波器;
步骤6:用步骤5中得到的最佳滤波器对yc进行滤波,获得增强后的语音。
2.根据权利要求1所述的基于统计模型的麦克风阵列语音增强方法,其特征在于步骤1中,采用以下方法建立用于语音帧分类的干净语音模型和计算出对应于每个分类的干净语音线性频谱模型:
步骤1.1:将干净语音库中的语音进行分帧预处理后,提取每帧的语音特征参数;
步骤1.2:用步骤1.1得到的语音特征参数训练用于语音帧分类的干净语音模型;
步骤1.3:使用干净语音模型对所有用于训练的语音帧进行分类;
步骤1.4:计算属于每个分类的所有语音帧的线性频谱,建立与每个分类对应的干净语音线性频谱模型。
3.根据权利要求2所述的基于统计模型的麦克风阵列语音增强方法,其特征在于步骤1.1中的语音特征参数为梅尔频率倒谱系数。
4.根据权利要求2所述的基于统计模型的麦克风阵列语音增强方法,其特征在于步骤1.2中,干净语音模型采用GMM或HMM。
5.根据权利要求2所述的基于统计模型的麦克风阵列语音增强方法,其特征在于步骤1.4中的干净语音线性频谱模型为干净语音线性频谱均值。
6.根据权利要求1所述的基于统计模型的麦克风阵列语音增强方法,其特征在于步骤3还进一步采用以下方法估计噪声的线性频谱均值:
步骤3.1:初始化M路非相干噪声的线性频谱均值Sin(ω)和自适应抵消器输出噪声的线性频谱均值Srn(ω),其中M为麦克风阵列的阵元数;
步骤3.2:采用下式估计噪声的线性频谱均值Sn(ω):
其中Wq为固定波束形成器的权值矩阵,为Wq的转置,Wa为自适应抵消器的权值矩阵,为Wa2的转置,T为满秩矩阵且满足其中B为阻塞矩阵,x为任意向量,y为Tx比Bx多出来的元素;
步骤3.3:采用下式更新Sin(ω)和Srn(ω):
S′in(ω)=αSb(ω)+(1-α)Sin(ω) (2)
S′rn(ω)=α′Yn(ω)+(1-α′)Srn(ω) (3)
其中S′in(ω)和S′rn(ω)分别为更新后的Sin(ω)和Srn(ω),Sb(ω)为麦克风阵列输入信号通过T后的输出信号,Yn(ω)为yn的频谱,α和α′为权重系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711201341.5/1.html,转载请声明来源钻瓜专利网。