[发明专利]一种非平稳噪声环境下传声器阵列的语音增强方法有效
申请号: | 201110427329.2 | 申请日: | 2011-12-19 |
公开(公告)号: | CN103165137A | 公开(公告)日: | 2013-06-19 |
发明(设计)人: | 吴鸣;杨飞然;杨军 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208 |
代理公司: | 北京法思腾知识产权代理有限公司 11318 | 代理人: | 杨小蓉;高宇 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 平稳 噪声 环境 传声器 阵列 语音 增强 方法 | ||
1.一种非平稳噪声环境下传声器阵列的语音增强方法,该方法包括的步骤如下:
(1)根据传声器阵列的输入信号估计出噪声参考信号r(n);
(2)采用自适应算法初步滤除各通道的输入信号中所含的噪声信号;
(3)对各通道中自适应滤波器的输出信号进行分帧加窗,再采用快速傅立叶变换变换至频域;
(4)估计背景噪声功率谱n(ω),并由此得到当前帧的信噪比SNR(n,ω);
(5)利用各通道之间的相位信息,再进一步根据和值与预定义门限T1的关系得到有效语音信号存在概率p1(n,ω);
(6)估计出当前帧是有效语音帧的概率pf(n);
(7)计算出输出信号在各个频率点增益G(n,ω);
(8)把处理后的频谱信号通过反傅里叶变换变换到时间域,作为输出信号;
所述步骤(5)中的估计出有效信号存在概率具体包括如下步骤:
(51)根据所需波束宽度计算门限T1=NL sin(θ)/Fs,其中N表示帧长,L表示传声器单元间距,θ表示波束宽度,Fs为采样频率;
(52)计算各通道输入信号在各频率点相位差ω的和值pd(n,ω);
(53)当pd(n,ω)>ω(M-1)T1时,该频率点存在有效信号概率p1(n,ω)=1,否则p1(n,ω)=0,其中,M表示传声器个数。
2.根据权利要求1所述的非平稳噪声环境下传声器阵列的语音增强方法,其特征在于,所述的步骤(6)中的估计当前帧是有效语音帧的概率具体包括如下步骤:
(61)当前帧能量判断当前帧为背景噪声帧;
(62)计算满足pd(n,ω)>ω(M-1)T1频率点个数C;
(63)如果当前帧为背景噪声帧,计算α为平滑系数;
(64)当时,pf(n)=0,否则pf(n)=1。
3.根据权利要求1或2所述的非平稳噪声环境下传声器阵列的语音增强方法,其特征在于,所述的传声器阵列为两个传声器单元,该方法的具体步骤包括:
(1)根据两个传声器输入信号计算参考背景噪声信号:
r(n)=x1(n)-x2(n);
其中,xi(n)表示第i个传声器在时刻n的输入信号;
(2)以背景噪声信号作为参考信号对传声器信号进行自适应滤波初步去除传声器输入信号中的噪声,所述的自适应滤波算法采用NLMS算法,具体描述如下:
wi(k,n)=wi(k,n-1)-μ(n)ei(n)n(n) k=0...K-1;
式中,K=20为自适应滤波器阶数,wi(k,n)为自适应滤波器系数;μ为归一化收敛系数,μ(n)为收敛系数;
(3)对自适应滤波器输出信号进行分帧加窗,再采用快速傅立叶转换求得对应的频域信号并计算波束输出:
(4)采用MCRA方法估计出背景噪声功率谱n(ω),并由此得到信号信噪比:
(5)根据两个传声器单元在各频率点的相位差:
其中,∠表示求取复数相位,
再进一步根据和值与预定义门限T1的关系得到有效语音信号存在概率:
其中,预定义门限T1为:
T1=NL sin(θ)/Fs,
式中,L表示传声器单元间距,θ表示波束宽度,Fs为采样频率;
(6)首先,计算满足pd(n,ω)>ω(M-1)T1频率点个数C;并计算当前帧总体能量:
如果判断当前帧为背景噪声帧,更新
最后,得到当前帧为有效语音帧概率:
(7)计算总体增益:
增强后信号为:z(n,ω)=G(n,ω)y(n,ω);
(8)通过反傅里叶变换转为时域信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110427329.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种偏心揉棉机
- 下一篇:井下立交巷道的施工方法