[发明专利]一种低信噪比环境下的端点检测方法在审
申请号: | 201910637142.1 | 申请日: | 2019-07-15 |
公开(公告)号: | CN110349598A | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 曾庆宁;卜玉婷;郑展恒 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L25/81;G10L25/84 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 覃永峰 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 端点检测 语音 倒谱系数 低信噪比 调制域 功率归一化 双门限判决 补偿相位 检测参数 特征参数 语音信号 噪声干扰 有效地 准确率 降噪 失真 噪声 检测 平衡 | ||
1.一种低信噪比环境下的端点检测方法,其特征在于,通过对带噪语音进行调制域谱减获得降噪和语音失真之间的平衡,从而改善语音质量,再结合功率归一化倒谱系数之间的距离进行端点检测。
2.根据权利要求1所述的低信噪比环境下的端点检测方法,其特征在于,包括以下主要步骤:
(一)对含噪语音进行调制域谱减并补偿相位得到增强后的语音;
(二)提取经过调制域谱减后的语音信号的PNCC特征参数,计算每帧信号PNCC倒谱系数与噪声倒谱系数之间的倒谱距离;将倒谱距离作为检测参数,根据NIS帧的PNCC倒谱距离求出阈值,再采用双门限判决方法进行端点检测。
3.根据权利要求2所述的低信噪比环境下的端点检测方法,其特征在于,步骤(一)具体分步骤如下:
(1)假设含噪语音由加性噪声和纯净语音组成,噪声和语音不相关,含噪信号可表示为:
y(n)=x(n)+d(n) (1)
其中x(n)为纯净信号,d(n)是噪声信号,n为离散时间索引;由于语音的短时平稳特性,对信号y(n)进行分帧、加窗后做短时傅里叶变换:
(2)为了直观地表达出信号的幅度谱和相位谱,可将短时傅里叶变换后的频谱表示为极坐标形式:
Y(n,k)=|Y(n,k)|ej∠K(n,k) (3)
(3)在每个频率点沿时间逐帧对幅度谱|Y(n,k)|进行短时傅里叶变换得到调制谱:
上式表示为极坐标形式如下所示:
Y(τ,k,m)=|Y(τ,k,m)|ej∠Y(τ,k,m) (5)
τ是调制帧,m为调制频率,X(τ,k,m)和分别是纯净信号和噪声信号的调制谱;|Y(τ,k,m)|和∠Y(τ,k,m)分别为含噪语音的调制幅度谱和调制相位谱;
(4)在调制域,使用谱减法改进调制谱幅度,如式(6)所示:
其中为调制域噪声谱幅值,ζ为引入的过减因子ζ≥1,v是增益补偿因子,γ决定谱减的类型,若γ=1为幅度谱减,若γ=2为功率谱减;调制域噪声幅值可通过式(7)估计得到:
其中θ是遗忘因子,当信号判定为噪声段时,更新噪声估计;
(5)因为带噪信号为实信号,故经过短时傅里叶变换得到的调制谱是共轭对称的,如式(8)所示:
Y(τ,k,m)=Y*(τ,N-k,m) (8)
通过使用反对称函数去改变共轭项之间的角度关系,继而可以补偿调制相位谱,其中相位谱补偿的度数根据噪声的调制幅度谱估计确定,相位补偿函数表达式如公式(9)所示:
其中相位补偿度数Λ(τ,k,m)由噪声的调制幅度谱计算得到,式中η为常数,φ(m)是反对称函数,如式(10)所示:
(6)改进的调制谱ZΛ(τ,k,m)由修正的调制域幅度估计和相位补偿度数Λ(τ,k,m)相加得到:
其中由修正后的幅度谱和含噪语音调制域相位谱组成,表达式为:
改进的调制域相位谱如式(13)所示:
∠ZΛ(τ,k,m)=ARG[ZΛ(τ,k,m)] (13)
(7)将修正的调制域幅度估计与经过补偿的调制域相位估计∠ZΛ(τ,k,m)相结合得到最终的调制谱,如式(14)所示:
结合修正后的幅度谱和含噪语音调制域相位谱做傅里叶反变换、去窗处理和重叠相加得到增强后的频域幅度谱;
最后结合频率相位谱再一次进行傅里叶反变换即可恢复出增强后的语音信号。
4.根据权利要求2所述的低信噪比环境下的端点检测方法,其特征在于,步骤(二)具体分步骤如下:
(1)对输入的语音信号进行预处理,包括采样量化、预加重、分帧加窗和短时傅里叶变换;
(2)对时频域转换分析后的序列进行功率谱计算,公式定义如式(16)所示:
其中FT(ω)是经过短时傅里叶变换以后得到的值;
(3)采用Gammatone听觉滤波器组对获得的功率谱进行滤波,Gammatone滤波器组的时域冲激响应如式(17)所示:
g(t)=at(n-1)e-2πbtcos(2πf0t+φ) (17)
其中n为滤波器阶数,b为滤波器带宽;
(4)通过计算长时帧功率、采用非对称滤波和临时掩蔽抑制背景噪声,长时帧功率计算公式如下:
上式中表示长时帧功率,P[s′,c]代表当前帧与前后各s帧中某一帧的功率谱,进行长时帧背景噪声估计的非对称滤波器公式定义如下:
式中代表滤波器输入输出,λa和λb为滤波器系数;
(5)采用时-频域归一化处理调整功率,其过程如下:
c1=max(c-N,1) (21)
c2=min(c+N,C) (22)
为估计的背景噪声系数,T[s,c]为时频归一化后的功率谱,再对功率谱进行归一化操作;
(6)将经过幂函数非线性处理后的信号序列通过DCT变换进行特征降维得到特征参数;
(7)通过倒谱均值归一化在每一个短时帧倒谱域上减去信道均值响应,有效避免信道卷积噪声在倒谱域上的干扰,最终得到PNCC特征参数;
(8)假设前导无话帧为噪声帧,取前5帧PNCC系数的平均值作为背景噪声帧的估计值,记为pc2(n),同时更新噪声倒谱系数,再计算每帧信号的PNCC倒谱系数与噪声倒谱系数pc2(n)之间的倒谱距离,如式(24)所示:
式中,p为PNCC倒谱分析中使用的阶数,采用16阶;
(9)将倒谱距离作为检测参数,采用双门限判决方法进行端点检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910637142.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音检测方法及装置
- 下一篇:音频播放方法及装置