[发明专利]音频信号的端点检测方法、装置、处理系统及计算机设备有效
申请号: | 201710493677.7 | 申请日: | 2017-06-26 |
公开(公告)号: | CN107331386B | 公开(公告)日: | 2020-07-21 |
发明(设计)人: | 余世经;朱频频 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L25/21 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 端点 检测 方法 装置 处理 系统 计算机 设备 | ||
本发明公开了音频信号的端点检测方法、装置、处理系统及计算机设备。该方法包括:基于待检测音频信号的功率谱及预先确定的噪声功率谱,确定待检测音频信号的端点检测判定参数;基于设定长度的检测结果标识数组中记录的各端点检测标记值,确定检测结果标识数组的端点检测标记值之和,根据端点检测判定参数及端点检测标记值之和,确定待检测音频信号的端点检测结果。利用该方法,能够在低信噪比的条件下依旧保持端点检测的高准确率,且噪声环境的变化并不影响本技术方案端点检测的准确度,更好地增强了语音端点检测随噪声环境变化时的鲁棒性。
技术领域
本发明涉及音频信号处理技术领域,尤其涉及音频信号的端点检测方法、装置、处理系统及计算机设备。
背景技术
语音端点检测(Voice Active Detection,VAD)是音频编码、音频识别以及音频增强等音频信号处理中的一个重要环节,它通常作为一种音频信号处理的预处理模块,能够将输入的音频信号划分为语音段和非语音段,后续可对语音段或非语音段进行区别性处理,从而达到音频信号处理的目标效果。
一般地,VAD的性能容易受到环境噪声的影响,在信噪比越低的环境下,语音端点检测也就越不准确。目前工程中常用的VAD算法,如基于短时能量和过零率的“双门限”的VAD算法,其性能会随着信噪比的下降而明显降低,在低信噪比(小于5dB)的环境下会基本上失去应用价值,另外,其针对噪声强度、噪声类型等声学场景的变化缺少鲁棒性,算法参数往往需要根据环境的变化进行训练和调节。
近年来出现的一些新的VAD算法,如基于谱熵的VAD算法,基于小波变换的VAD算法等,在抗噪性能和鲁棒性方面都有所提高,但计算较为复杂,目前工程实际中应用的并不多。目前比较有代表性的VAD算法是由ITU-T的G.729Annex B提出的,该算法利用音频信号的短时平稳性,将待检测的音频信号以“帧”为单位分成若干段(每10~30ms长的数据为一帧,音频信号在该时间段范围内可被认为是平稳信号),最终返回音频信号帧为语音信号帧或非语音信号帧的检测结果。具体地,G.729Annex B的VAD算法主要分为两步进行:第一步,待检测的一帧音频信号中提取4个特征参数,分别是:线谱频率LSF,过零率ZC,全带宽信号能量Ef,低频带信号能量Ei,然后用这些特征参数和各参数的门限阈值比较,做出初步的VAD判决Ivd;第二步,对初步判决结果进行平滑处理,得到平滑后的判决结果Svd。平滑后的判决结果可以使语音帧和非语音帧之间的切换更为自然,在一定程度上降低有用语音信息的丢失。G.729Annex B的VAD算法的缺陷在于:它面对噪声环境变化的鲁棒性不足,并且在信噪比较低的环境下,语音端点检测的准确性会明显下降。
发明内容
本发明实施例提供了音频信号的端点检测方法、装置、处理系统及计算机设备,更好地增强了语音端点检测随噪声环境变化时的鲁棒性,从而提高了音频信号中语音信号检测的准确性。
第一方面,本发明实施例提供了一种音频信号的端点检测方法,包括:
基于待检测音频信号的功率谱及预先确定的噪声功率谱,确定所述待检测音频信号的端点检测判定参数;
基于设定长度的检测结果标识数组中记录的各端点检测标记值,确定所述检测结果标识数组的端点检测标记值之和,其中,所述端点检测标记值为语音端点标记值或非语音端点标记值;
根据所述端点检测判定参数及所述端点检测标记值之和,确定所述待检测音频信号的端点检测结果。
第二方面,本发明实施例提供了一种音频信号的端点检测装置,包括:
判定参数确定模块,用于基于待检测音频信号的功率谱及预先确定的噪声功率谱,确定所述待检测音频信号的端点检测判定参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710493677.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于窗式空调器的伸缩帘
- 下一篇:一种汉字语音片段的确定方法及装置