[发明专利]一种带噪语音的噪声可容度判断方法有效
申请号: | 201711372174.0 | 申请日: | 2017-12-19 |
公开(公告)号: | CN107910016B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 王亦红 | 申请(专利权)人: | 河海大学 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L25/51 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 210098 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 噪声 可容度 判断 方法 | ||
本发明公开了一种带噪语音的噪声可容度判断方法,选取带噪语音样本,计算每个带噪语音样本信号各个频率点的先验信噪比,并找出其中最小的先验信噪比;对比各个样本的最小先验信噪比,确定带噪语音信号噪声可容度的阈值。对带噪语音进行分帧和预加重,并进行端点检测;对噪声和带噪语音分别进行功率谱估计;计算每一帧各个频率点的先验信噪比。若有一个及其以上频率点的先验信噪比小于阈值,则该帧语音的噪声不可容,需语音增强处理。若该帧各个频率点的先验信噪比均大于阈值,则该帧语音信号的噪声可容,无需语音增强处理。根据该判断方法,可识别噪声可容的带噪语音。对于噪声可容的带噪语音,无需语音增强,从而避免了有效信息的丢失。
技术领域
本发明涉及一种判断带噪语音的噪声是否可容的方法,属于带噪语音信号的处理技术领域。
背景技术
在语音信号处理中,带噪语音经过语音增强以后,在提高其信噪比的同时,会造成部分有效语音信息的丢失,引起语音信号失真。根据人耳的听觉掩蔽效应,语音信号的存在可提高其背景噪声被人耳听见的阈值。基于该原理,有些带噪语音信号的背景噪声可不被人耳听见,或者即便被人耳听见,也不会让人产生不舒适感。本发明将此类背景噪声称之为可容噪声,并且给出了判断噪声是否可容的方法。
发明内容
发明目的:针对现有技术中存在的问题,本发明提供一种带噪语音的噪声可容度判断方法,对于带噪语音信号,若判断其背景噪声可容,则在信号处理时,可不进行消噪,避免了消噪引起的有效语音信息的丢失,从而最大限度保留了有效信息。
技术方案:一种带噪语音的噪声可容度判断方法,包括阈值的确定和基于阈值的判断两部分。
第一部分确定阈值的步骤
第一步,录几段纯语音信号
第二步,在Noisex-92噪声库,分别从冲激噪声、宽带噪声、周期噪声和语音干扰四类噪声信号中,各提取多种场景噪声样本。
第三步,分别将每一个噪声样本加入第一步录制的各个纯语音信号中,形成各种带噪语音信号。在0dB到20dB的信噪比范围内,基于不同信噪比,对每一个带噪语音进行增强处理。
第四步,分别对语音增强前、后的每一个带噪语音进行MOS打分。
第五步,将基于不同信噪比的同一种带噪语音作为一组,从中找出语音增强前、后MOS打分趋同的信号,并且将其中信噪比相对最低的信号作为这种带噪语音的样本信号。
第六步,对带噪语音样本进行分帧和预加重处理,然后,对带噪语音样本进行端点检测,并分别对噪声和带噪语音进行功率谱估计;
第七步,分别计算每个带噪语音样本的每一帧中各个频率点的先验信噪比:
式中ξ(n,k)—第n帧第k频率点的先验信噪比;
—第n帧在第k频率点的带噪语音功率。
—第n帧在第k频率点的噪声功率。
α—取值为0.98
找出每个带噪语音样本的最小先验信噪比。对比各个样本的最小先验信噪比,确定带噪语音噪声可容度的阈值。基于上述步骤,本发明确定的阈值为0.95-1.05。
第二部分判断带噪语音信号的噪声是否可容
第一步,对带噪语音信号进行分帧和预加重处理,
第二步,对带噪语音信号本进行端点检测,
第三步,分别对噪声和带噪语音进行功率谱估计;
第四步,根据式(1)分别计算带噪语音每一帧中各个频率点的先验信噪比:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711372174.0/2.html,转载请声明来源钻瓜专利网。