[发明专利]一种检测语音端点的方法及系统有效
申请号: | 201110451112.5 | 申请日: | 2011-12-29 |
公开(公告)号: | CN102522081A | 公开(公告)日: | 2012-06-27 |
发明(设计)人: | 宋辉 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L11/02 | 分类号: | G10L11/02 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何青瓦;李庆波 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 语音 端点 方法 系统 | ||
技术领域
本发明涉及计算机技术领域,特别涉及一种检测语音端点的方法及系统。
背景技术
现有的语音端点检测技术是基于一个前提,即假设语音的起始段是噪声,并利用起始噪声段训练门限值。这种假设在手机语音搜索应用上未必总是成立的,有时用户按下搜索按钮后会马上开始说话,此时,现有的端点检测技术的门限值训练将会出错,导致起点和终点的检测不准确。
基于上述假设,现有的语音端点检测方法采用的流程是假设起始段为非语音段,将语音信号分帧,逐帧提取特征值,利用所述特征值与事先设定的门限值相比,如果大于等于门限值,则判定为语音,如果小于门限值,则判定为噪声,从而得到语音的起点和终点信息。这种“顺序判断”方法最大的问题在于对预设门限值的过分依赖。一旦预设门限值计算有误差,则语音端点检测的性能会大受影响。而现有的利用噪声段计算门限的前提假设条件在语音搜索的应用中未必总能满足。
发明内容
本发明提供了一种检测语音端点的方法及系统,用以解决现有语音端点检测技术的性能较差的问题。
具体技术方案如下:
一种检测语音端点的方法,包括下列步骤:
A1、按照第一方向顺序,搜索输入的音频段中的各帧,若当前帧的特征值大于等于当前门限值,则利用当前帧的特征值更新当前门限值;
A2、若连续N帧的特征值均小于当前门限值,则判定检测到所述音频段的语音第二端点并终止第一方向搜索过程,所述N为预设帧数;
A3、按照第二方向顺序,从检测到的语音第二端点开始搜索,利用所述连续N帧的特征值检测所述音频段的语音第一端点;
当所述第一方向为正向时,所述第二方向为反向,所述第一端点为起点,所述第二端点为终点;
当所述第一方向为反向时,所述第二方向为正向,所述第一端点为终点,所述第二端点为起点。
根据本发明一优选实施例,步骤A1中所述的更新当前门限值的公式具体包括:
T1=αT0+(1-α)f;
其中,T0为当前门限值;T1为更新后的门限值;f为当前帧的特征值;α为遗忘因子,取值范围在0至1之间。
根据本发明一优选实施例,步骤A1中从所述音频段的第一方向上的第一帧开始搜索,以及将所述音频段的第一帧的特征值作为初始门限值;或者,
如果上一音频段按照第一方向顺序未检测到语音第二端点,则利用上一音频段按照第一方向顺序搜索结束后得到的当前门限值作为所述输入的音频段在所述步骤A1的初始门限值。
根据本发明一优选实施例,步骤A3中所述的利用连续N帧的特征值检测音频段的语音第一端点,具体包括:
A311、取所述连续N帧的特征值的平均值作为第二方向搜索的初始门限值,或者,利用公式Trev=Tn+β(T0-Tn)确定第二方向搜索的初始门限值,其中,T0为当前门限值;Tn为所述连续N帧特征值的平均值;β为尺度因子,取值范围在0至1之间;Trev为第二方向搜索的初始门限值;
A312、在第二方向搜索过程中,从所述语音第一端点开始搜索,若当前帧的特征值大于等于当前门限值,则利用当前帧的特征值更新当前门限值;
A313、若连续M帧的特征值均小于当前门限值,则判定检测到所述音频段的语音第一端点;或者,搜索至所述音频段的第一方向上的第一帧,未搜到连续M帧的特征值均小于当前门限值,则以所述音频段的第一方向上的第一帧作为语音第一端点;所述M为预设帧数。
根据本发明一优选实施例,步骤A3中所述的利用连续N帧的特征值检测音频段的语音第一端点,具体包括:
A321、通过下述公式确定第二方向搜索的初始门限值;
Trev=Tn+β(T0-Tn);
其中,T0为当前门限值;Tn为所述连续N帧特征值的平均值;β为尺度因子,取值范围在0至1之间;Trev为第二方向搜索的初始门限值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110451112.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:热水包
- 下一篇:倍压整流高压供电的串联LED恒流驱动电路