[发明专利]一种带噪语音端点检测中阈值设定的方法在审
申请号: | 201711372176.X | 申请日: | 2017-12-19 |
公开(公告)号: | CN107910017A | 公开(公告)日: | 2018-04-13 |
发明(设计)人: | 王亦红 | 申请(专利权)人: | 河海大学 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0232;G10L25/45;G10L25/78;G10L25/21 |
代理公司: | 南京苏高专利商标事务所(普通合伙)32204 | 代理人: | 李玉平 |
地址: | 210098 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 端点 检测 阈值 设定 方法 | ||
1.一种带噪语音端点检测中阈值设定的方法,其特征在于,包括如下步骤:
第一步,采集带噪语音信号,并进行预处理;
第二步,计算幅熵比Fn;
第三步,对幅熵比进行中值滤波,达到平滑滤波的效果;
第四步,设定阈值T1和T2;
第五步,对当前帧的判定,根据阈值T1、T2从输入信号中找出带噪语音部分的起止点。
2.如权利要求1所述的带噪语音端点检测中阈值设定的方法,其特征在于,计算幅熵比
3.如权利要求1所述的带噪语音端点检测中阈值设定的方法,其特征在于,取10帧作为固定窗长,选择前10帧作为初始固定窗长,计算窗长中每一帧的幅熵比Fn,计算Fn在固定窗长内的均值E和最大值M,计算最大值M和均值E的差值D,设定阈值T1=0.1D+E,T2=0.05D+E。
4.如权利要求1所述的带噪语音端点检测中阈值设定的方法,其特征在于,对当前帧的判定,根据阈值T1、T2从输入信号中找出带噪语音部分的起止点,具体过程如下:
若当前帧为首帧,判断首帧的Fn是否大于T1,如果大于,则判断此帧为带噪语音帧的起始点;如果小于,则判断此帧为纯噪声帧;
若当前帧的前一帧已经判定为带噪语音帧,则判断当前帧的Fn是否大于T2。如果大于,则判定当前帧仍然为带噪语音帧,如果小于,则判定当前帧的前一帧为语音段的终点,噪声段从当前帧开始;
若当前帧的前一帧已被判定为纯噪声帧,则判断当前帧的Fn是否大于T1,如果大于T1,则认为当前帧为语音段的起始点,否则,需进一步判断当前帧的Fn是否大于T2,如果当前帧的Fn大于T2,则判定当前帧为语音的潜在帧,并将该帧序号i保存,如果小于T2,则认为当前帧仍为纯噪声帧,并且以此帧的Fn更新E和M;
若当前帧的前一帧为语音的潜在帧,则判断当前帧的Fn是否大于T1,如果大于,则判定当前帧为带噪语音帧,并且序号为i的帧为带噪语音的起始帧;否则,需进一步判断当前帧的Fn是否大于T2;如果大于T2,则认为此帧依然是潜在语音帧,如果小于T2,则认为当前帧为纯噪声帧,并且以此帧的Fn更新E和M。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711372176.X/1.html,转载请声明来源钻瓜专利网。