[发明专利]一种语音激活检测方法有效

申请号：	201711407711.0	申请日：	2017-12-22
公开（公告）号：	CN108039182B	公开（公告）日：	2021-10-08
发明（设计）人：	张亦希;陈晨;王陈春;王业芳;常浩宇;王蕴;舒敏;王琼	申请（专利权）人：	西安烽火电子科技有限责任公司
主分类号：	G10L25/84	分类号：	G10L25/84;G10L25/78;G10L25/21
代理公司：	西安睿通知识产权代理事务所(特殊普通合伙) 61218	代理人：	寇兰英
地址：	710075 陕西省西***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音激活检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明属于语音信号处理技术领域，公开了一种语音激活检测方法，利用语音信号具有较强自相关度而噪声具有较弱自相关度的特点来进行语音激活检测，不仅能够在较强的噪声环境下实现较小的漏检和误捡概率，而且具有较低的计算复杂度，易于在各种嵌入式平台中实现。

技术领域

本发明属于语音信号处理技术领域，尤其涉及一种语音激活检测方法。

背景技术

对于电台IP网关，由于电台一般只能进行半双工语音通信，而来自IP网络的语音信号通常都是全双工的语音信号，因此电台IP网关就需要能够实现全双工与半双工间的相互转换，即当发现来自IP网络的音频信号中没有语音只有噪声时，使电台处于接收状态，并将电台收到的音频信号送给IP网络，而当来自IP网络的音频信号包含语音信号时，则使电台处于发送状态，并将来自IP网络的语音信号通过电台发送出去。

因此，电台IP网关需要使用语音激活检测算法来对来自IP网络的音频信号是否包含语音进行检测，对语音激活检测算法的要求通常包括：(1)具有较低的复杂度，由于电台IP网关通常采用嵌入式平台(如：各种ARM平台)，且使用Linux操作系统来处理各种协议，因此语音激活检测算法必须具有较低的算法复杂度，以便能够在各种嵌入式Linux平台上运行；(2)具有较强的抗噪声性能，由于从不同地点通过IP网络送来的语音信号往往包含幅度不同的噪声信号，因此语音激活检测算法必须能够在较强的噪声环境下实现较小的漏检和误捡概率。

目前，在嵌入式Linux平台上使用最多的语音激活检测是短时能量和过零率语音激活检测算法。短时能量和过零率语音激活检测算法将算出的能量和过零率与预先设定的门限比较，若两者同时超过门限则判当前帧为语音帧，若两者同时或其中之一低于另一组门限时，则判当前帧为噪声，该算法过于简单，从而导致它的抗噪声性能较差，即在较强的噪声环境下会有较大的漏检和误捡概率。

发明内容

针对上述问题，本发明的目的在于提供一种语音激活检测方法，不仅能够在较强的噪声环境下实现较小的漏检和误捡概率，而且具有较低的计算复杂度，易于在各种嵌入式平台中实现。

为达到上述目的，本发明采用如下技术方案予以实现。

一种语音激活检测方法，所述语音激活检测方法包括：

步骤1，获取音频信号采样流，将所述音频信号采样流分为连续的多帧音频采样；

步骤2，设置语音门限和噪音门限，计算第i帧音频采样的自相关度，其中，1≤i≤M，M为所述音频信号采样流包含的音频采样总帧数；

步骤3，当所述第i帧音频采样的自相关度大于所述语音门限时，判定所述第i帧音频采样为语音帧；

当所述第i帧音频采样的自相关度小于所述噪音门限时，判定所述第i帧音频采样为噪音帧；

否则，当i＝1时，判定所述第1帧音频采样为噪音帧；

当i＞1时，所述第i帧音频采样与第i-1帧音频采样的判定结果相同。

本发明技术方案的特点和进一步的改进为：

(1)步骤2中，计算第i帧音频采样的自相关度R_i，具体为：