[发明专利]一种带噪语音的噪声可容度判断方法有效
申请号: | 201711372174.0 | 申请日: | 2017-12-19 |
公开(公告)号: | CN107910016B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 王亦红 | 申请(专利权)人: | 河海大学 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L25/51 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 210098 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 噪声 可容度 判断 方法 | ||
1.一种带噪语音的噪声可容度判断方法,其特征在于,包括阈值的确定和基于阈值的判断两部分,具体为:
(1)确定阈值的步骤:
(1.1)录几段纯语音信号;
(1.2)在Noisex-92噪声库,分别从冲激噪声、宽带噪声、周期噪声和语音干扰四类噪声信号中,各提取多种场景噪声样本;
(1.3)分别将每一个噪声样本加入第一步录制的各个纯语音信号中,形成各种带噪语音信号,在0dB到20dB的信噪比范围内,基于不同信噪比,对每一个带噪语音进行增强处理;
(1.4)分别对语音增强前、后的每一个带噪语音进行MOS打分;
(1.5)将基于不同信噪比的同一种带噪语音作为一组,从中找出语音增强前、后MOS打分趋同的信号,并且将其中信噪比相对最低的信号作为这种带噪语音的样本信号;
(1.6)对带噪语音样本进行分帧和预加重处理,然后,对带噪语音样本进行端点检测,并分别对噪声和带噪语音进行功率谱估计;
(1.7)分别计算每个带噪语音样本的每一帧中各个频率点的先验信噪比:
式中ξ(n,k)为第n帧第k频率点的先验信噪比;为第n帧在第k频率点的带噪语音功率;为第n帧在第k频率点的噪声功率;α的取值为0.98;
找出每个带噪语音样本的最小先验信噪比,对比各个样本的最小先验信噪比,确定带噪语音噪声可容度的阈值,基于上述步骤,本发明确定的阈值为0.95-1.05;
(2)判断带噪语音信号的噪声是否可容:
(2.1)对带噪语音信号进行分帧和预加重处理;
(2.2)对带噪语音信号本进行端点检测;
(2.3)分别对噪声和带噪语音进行功率谱估计;
(2.4)根据式(1)分别计算带噪语音每一帧中各个频率点的先验信噪比;
(2.5)在0.95-1.05范围内选取阈值,如果带噪语音帧的每个频率点的先验信噪比小于所选取的阈值,则认为该带噪语音帧的噪声不可容,需要语音增强;反之,则被认为是可容的,无需增强。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711372174.0/1.html,转载请声明来源钻瓜专利网。