[发明专利]语音活动检测方法、装置、电子设备和存储介质在审
申请号: | 202110791186.7 | 申请日: | 2021-07-13 |
公开(公告)号: | CN113486964A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 奚少亨;蒋华晨;王江 | 申请(专利权)人: | 盛景智能科技(嘉兴)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G11B20/10;G06F17/18 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 聂俊伟 |
地址: | 314506 浙江省嘉兴市桐乡*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 活动 检测 方法 装置 电子设备 存储 介质 | ||
本发明提供一种语音活动检测方法、检测装置和电子设备,其中所述检测方法包括:获取第一声音信号;对所述第一声音信号进行延迟处理,得到第二声音信号;提取所述第二声音信号的基音特征,基于所述基音特征,生成第一判断结果;更新所述第二声音信号的信噪比,基于所述信噪比,生成第二判断结果;基于所述第一判断结果和所述第二判断结果,确定最终判断结果。本发明的语音活动检测方法,根据本发明实施例提供的语音活动检测方法,通过对第一声音信号进行延迟处理,并融合第二声音信号的基音特征和噪声功率谱进行联合控制,增加了判断的鲁棒性,进一步提高了语音活动检测的准确性和普适性。
技术领域
本发明涉及语音检测技术领域,尤其涉及一种语音活动检测方法、装置、电子设备和存储介质。
背景技术
语音活动检测在语音交互系统中至关重要,在进行语音识别之前,如果不先对语音信号是否为语音进行判断,则需要保持语音识别装置一直处于开启状态,这会浪费大量的功耗,因此,在进行语音识别之前,先进行语音活动检测,可用来降低计算量和功耗,还可以作为自适应滤波器的更新标志。现有技术中,一般通过能量和过零率来进行语音活动检测。基于能量的语音活动检测,仅适用于对信噪比较高的音频信号的判断;而由于随机噪声和清音的过零率较为接近,基于过零率的语音活动检测无法区分清音和噪声,整体来看,现有技术对语音活动检测的准确率不高。
发明内容
本发明提供一种语音活动检测方法、装置、电子设备和存储介质,用以解决现有技术中语音活动检测准确率不高的缺陷,实现快速、准确地语音活动检测。
本发明提供一种语音活动检测方法,包括:
获取第一声音信号;
对所述第一声音信号进行延迟处理,得到第二声音信号;
提取所述第二声音信号的基音特征,基于所述基音特征,生成第一判断结果;
更新所述第二声音信号的信噪比,基于所述信噪比,生成第二判断结果;
基于所述第一判断结果和所述第二判断结果,确定最终判断结果。
根据本发明提供的一种语音活动检测方法,所述提取所述第二声音信号的基音特征,基于所述基音特征,生成第一判断结果,包括:
提取所述第二声音信号的基音特征,得到基音线性预测滤波器延迟、基因线性预测滤波器增益和频谱包络的第一峰值频率;
将所述基音线性预测滤波器延迟、所述基因线性预测滤波器增益和所述频谱包络的第一峰值频率输入高斯混合模型,得到概率密度函数;
基于所述概率密度函数,联合线性预测滤波器的增益和共振峰位置,生成所述第一判断结果。
根据本发明提供的一种语音活动检测方法,所述更新所述第二声音信号的信噪比,基于所述信噪比,生成第二判断结果,包括:
更新所述第二声音信号的先验信噪比和后验信噪比;
比较更新后的所述后验信噪比与第一目标阈值,生成所述第二判断结果。
根据本发明提供的一种语音活动检测方法,所述基于所述第二声音信号,更新先验信噪比和后验信噪比,包括:
基于所述第二声音信号,利用最小值追踪算法MCRA更新先验信噪比和后验信噪比;
或者,基于所述第二声音信号,采用递归平均算法更新先验信噪比和后验信噪比;
或者,基于所述第二声音信号,采用最优控制算法更新先验信噪比和后验信噪比。
根据本发明提供的一种语音活动检测方法,所述基于所述第一判断结果和所述第二判断结果,确定最终判断结果,包括:
对所述第一判断结果和所述第二判断结果进行加权计算,生成第三判断结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盛景智能科技(嘉兴)有限公司,未经盛景智能科技(嘉兴)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110791186.7/2.html,转载请声明来源钻瓜专利网。