[发明专利]一种非平稳噪声环境下传声器阵列的语音增强方法有效

申请号：	201110427329.2	申请日：	2011-12-19
公开（公告）号：	CN103165137A	公开（公告）日：	2013-06-19
发明（设计）人：	吴鸣;杨飞然;杨军	申请（专利权）人：	中国科学院声学研究所
主分类号：	G10L21/0208	分类号：	G10L21/0208
代理公司：	北京法思腾知识产权代理有限公司 11318	代理人：	杨小蓉;高宇
地址：	100190 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种平稳噪声环境传声器阵列语音增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种非平稳噪声环境下传声器阵列的语音增强方法，该方法包括的步骤如下：

(1)根据传声器阵列的输入信号估计出噪声参考信号r(n)；

(2)采用自适应算法初步滤除各通道的输入信号中所含的噪声信号；

(3)对各通道中自适应滤波器的输出信号进行分帧加窗，再采用快速傅立叶变换变换至频域；

(4)估计背景噪声功率谱n(ω)，并由此得到当前帧的信噪比SNR(n，ω)；

(5)利用各通道之间的相位信息，再进一步根据和值与预定义门限T₁的关系得到有效语音信号存在概率p₁(n，ω)；

(6)估计出当前帧是有效语音帧的概率p_f(n)；

(7)计算出输出信号在各个频率点增益G(n，ω)；

(8)把处理后的频谱信号通过反傅里叶变换变换到时间域，作为输出信号；

所述步骤(5)中的估计出有效信号存在概率具体包括如下步骤：

(51)根据所需波束宽度计算门限T₁＝NL sin(θ)/Fs，其中N表示帧长，L表示传声器单元间距，θ表示波束宽度，Fs为采样频率；

(52)计算各通道输入信号在各频率点相位差ω的和值pd(n，ω)；

(53)当pd(n，ω)＞ω(M-1)T₁时，该频率点存在有效信号概率p₁(n，ω)＝1，否则p₁(n，ω)＝0，其中，M表示传声器个数。

2.根据权利要求1所述的非平稳噪声环境下传声器阵列的语音增强方法，其特征在于，所述的步骤(6)中的估计当前帧是有效语音帧的概率具体包括如下步骤：

(61)当前帧能量判断当前帧为背景噪声帧；

(62)计算满足pd(n，ω)＞ω(M-1)T₁频率点个数C；

(63)如果当前帧为背景噪声帧，计算α为平滑系数；

(64)当时，p_f(n)＝0，否则p_f(n)＝1。

3.根据权利要求1或2所述的非平稳噪声环境下传声器阵列的语音增强方法，其特征在于，所述的传声器阵列为两个传声器单元，该方法的具体步骤包括：

(1)根据两个传声器输入信号计算参考背景噪声信号：

r(n)＝x₁(n)-x₂(n)；

其中，x_i(n)表示第i个传声器在时刻n的输入信号；

(2)以背景噪声信号作为参考信号对传声器信号进行自适应滤波初步去除传声器输入信号中的噪声，所述的自适应滤波算法采用NLMS算法，具体描述如下：

w_i(k，n)＝w_i(k，n-1)-μ(n)e_i(n)n(n) k＝0...K-1；

μ(n)=μΣm-0K-1|r(n-m)|2;]]>

x^i(n)=xi(n)-Σm=0K-1w(k-m,n-1)r(n-m);]]>

式中，K＝20为自适应滤波器阶数，w_i(k，n)为自适应滤波器系数；μ为归一化收敛系数，μ(n)为收敛系数；

(3)对自适应滤波器输出信号进行分帧加窗，再采用快速傅立叶转换求得对应的频域信号并计算波束输出：

y(n,ω)=x^1(n,ω)+x^2(n,ω);]]>

(4)采用MCRA方法估计出背景噪声功率谱n(ω)，并由此得到信号信噪比：

SNR(n,ω)=|y(n,ω)n(ω)|2;]]>

(5)根据两个传声器单元在各频率点的相位差：

pd(n,ω)=∠[x1f(n,ω)x2f(n,ω)];]]>

其中，∠表示求取复数相位，

再进一步根据和值与预定义门限T₁的关系得到有效语音信号存在概率：

其中，预定义门限T₁为：

T₁＝NL sin(θ)/Fs，

式中，L表示传声器单元间距，θ表示波束宽度，Fs为采样频率；

(6)首先，计算满足pd(n，ω)＞ω(M-1)T₁频率点个数C；并计算当前帧总体能量：

E(n)=Σk=0N-1|y(n,k)|2;]]>

如果判断当前帧为背景噪声帧，更新

最后，得到当前帧为有效语音帧概率：

(7)计算总体增益：

G(n,ω)=SNG(n,ω)1+SNR(n,ω)p1(n,ω)pf(n);]]>

增强后信号为：z(n，ω)＝G(n，ω)y(n，ω)；

(8)通过反傅里叶变换转为时域信号。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所，未经中国科学院声学研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201110427329.2/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种非平稳噪声环境下传声器阵列的语音增强方法有效

专利文献下载