[发明专利]一种语音激活检测方法有效
申请号: | 201711407711.0 | 申请日: | 2017-12-22 |
公开(公告)号: | CN108039182B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 张亦希;陈晨;王陈春;王业芳;常浩宇;王蕴;舒敏;王琼 | 申请(专利权)人: | 西安烽火电子科技有限责任公司 |
主分类号: | G10L25/84 | 分类号: | G10L25/84;G10L25/78;G10L25/21 |
代理公司: | 西安睿通知识产权代理事务所(特殊普通合伙) 61218 | 代理人: | 寇兰英 |
地址: | 710075 陕西省西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 激活 检测 方法 | ||
本发明属于语音信号处理技术领域,公开了一种语音激活检测方法,利用语音信号具有较强自相关度而噪声具有较弱自相关度的特点来进行语音激活检测,不仅能够在较强的噪声环境下实现较小的漏检和误捡概率,而且具有较低的计算复杂度,易于在各种嵌入式平台中实现。
技术领域
本发明属于语音信号处理技术领域,尤其涉及一种语音激活检测方法。
背景技术
对于电台IP网关,由于电台一般只能进行半双工语音通信,而来自IP网络的语音信号通常都是全双工的语音信号,因此电台IP网关就需要能够实现全双工与半双工间的相互转换,即当发现来自IP网络的音频信号中没有语音只有噪声时,使电台处于接收状态,并将电台收到的音频信号送给IP网络,而当来自IP网络的音频信号包含语音信号时,则使电台处于发送状态,并将来自IP网络的语音信号通过电台发送出去。
因此,电台IP网关需要使用语音激活检测算法来对来自IP网络的音频信号是否包含语音进行检测,对语音激活检测算法的要求通常包括:(1)具有较低的复杂度,由于电台IP网关通常采用嵌入式平台(如:各种ARM平台),且使用Linux操作系统来处理各种协议,因此语音激活检测算法必须具有较低的算法复杂度,以便能够在各种嵌入式Linux平台上运行;(2)具有较强的抗噪声性能,由于从不同地点通过IP网络送来的语音信号往往包含幅度不同的噪声信号,因此语音激活检测算法必须能够在较强的噪声环境下实现较小的漏检和误捡概率。
目前,在嵌入式Linux平台上使用最多的语音激活检测是短时能量和过零率语音激活检测算法。短时能量和过零率语音激活检测算法将算出的能量和过零率与预先设定的门限比较,若两者同时超过门限则判当前帧为语音帧,若两者同时或其中之一低于另一组门限时,则判当前帧为噪声,该算法过于简单,从而导致它的抗噪声性能较差,即在较强的噪声环境下会有较大的漏检和误捡概率。
发明内容
针对上述问题,本发明的目的在于提供一种语音激活检测方法,不仅能够在较强的噪声环境下实现较小的漏检和误捡概率,而且具有较低的计算复杂度,易于在各种嵌入式平台中实现。
为达到上述目的,本发明采用如下技术方案予以实现。
一种语音激活检测方法,所述语音激活检测方法包括:
步骤1,获取音频信号采样流,将所述音频信号采样流分为连续的多帧音频采样;
步骤2,设置语音门限和噪音门限,计算第i帧音频采样的自相关度,其中,1≤i≤M,M为所述音频信号采样流包含的音频采样总帧数;
步骤3,当所述第i帧音频采样的自相关度大于所述语音门限时,判定所述第i帧音频采样为语音帧;
当所述第i帧音频采样的自相关度小于所述噪音门限时,判定所述第i帧音频采样为噪音帧;
否则,当i=1时,判定所述第1帧音频采样为噪音帧;
当i>1时,所述第i帧音频采样与第i-1帧音频采样的判定结果相同。
本发明技术方案的特点和进一步的改进为:
(1)步骤2中,计算第i帧音频采样的自相关度Ri,具体为:
其中,N表示第i帧音频采样包含的采样点总个数,xi(k)表示第i帧音频采样中的第k个采样点,xi(k+1)表示第i帧音频采样中的第k+1个采样点,sgn(.)表示符号函数,C表示大于零的设定常数。
(2)设第1帧音频采样为噪音帧,计算第1帧音频采样的噪声能量E,根据所述噪声能量E确定常数C:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安烽火电子科技有限责任公司,未经西安烽火电子科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711407711.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于IC卡收费系统的智能纠错方法
- 下一篇:一种加强型特微轴承