[发明专利]一种基于EMD-Wavelet的MFCC相似度的语音段检测方法有效
申请号: | 201811553681.9 | 申请日: | 2018-12-19 |
公开(公告)号: | CN109410977B | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 贾民平;花园;胡建中;许飞云;黄鹏 | 申请(专利权)人: | 东南大学 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L25/24;G10L25/51;G10L25/78 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 emd wavelet mfcc 相似 语音 检测 方法 | ||
本发明公开了一种基于EMD‑Wavelet的MFCC相似度的语音段检测方法。采集说话人的语音信号作为源信号;利用经验模态分解(EMD)对含噪的语音信号进行分解,得到体现语音信号高低频能量的各阶本征模函数(IMF);以各阶IMF分量的自相关系数的方差确定噪声为主导模态的IMF阶数,对噪声为主导模态的IMF进行小波阈值降噪,用降噪后的低阶IMF分量和余下的高阶IMF分量重构,获得降噪后的语音信号;计算语音信号的Mel倒谱参数(MFCC),以欧氏距离作为语音信号MFCC相似度的测度;从相似度曲线中可以明显区分语音段和噪声段,从而实现语音段的提取。相比于传统的检测方法,本发明具有更好的鲁棒性和适应性,语音段检测的准确率更高,能够很好的应用于语音信号的语音段提取。
技术领域:
本发明涉及一种基于EMD-Wavelet的MFCC相似度的语音段检测方法,属于语音信号处理中语音段的检测领域。
背景技术:
语音段检测是语音信号分析处理的重要环节,其目的是从包含语音的一段信号中提取语音信号的语音段,其检测精度直接影响对语音信号的处理时间和运算量。因此,提高语音段起止点检测的准确率和效率一直是语音识别技术研究中的热点。传统的语音段检测算法常采用短时能量、短时过零率和自相关最大值等方法,这些方法在高信噪比情况下得到了比较好的检测效果,然而,在低信噪比情况下检测效果很差。后来学者们相继提出了多种在噪声环境下的语音段检测方法,在一定程度上降低了噪声的影响。其中,小波分析具有良好的时频局域性,特别适合于非平稳语音信号的分析,在信号去噪领域得到了广泛的应用,但是小波去噪方法也存在一些缺点,如去噪效果与信号特点及小波基函数有很大关系,当信噪比较小时,去噪效果不理想。EMD是基于信号本身的时间尺度特征的时频分析方法,可以直接把复杂信号由精细尺度到粗大尺度分解为若干本征模态分量(Intrinsicmodefunction,IMF)和一个余项,克服了小波去噪需要选择基函数的缺点,但消噪效果整体上不如小波阈值消噪。Mel倒谱参数(MFCC)特征对于语音信号性质的依赖性不强,该特征参数的依靠人耳听觉模型,对低频信号灵敏,而对高频信号比较模糊。虽然MFCC能够很好地体现语音信号的信号特征,但在信噪比较低的情况下,MFCC用于语音段检测的效果并不明显。本发明根据语音信号非线性、非平稳性的特点,利用小波分析对语音信号的高低频部分有较好分辨率的优势,将EMD和小波分析相结合,分析了语音信号中语音和非语音段的MFCC参数特征,提出了一种基于EMD-Wavelet的MFCC相似度的语音段检测方法。实验结果表明,该方法在不同噪声环境下均能得到理想的语音段提取效果,且在低信噪比时优势更明显。
发明内容
为提高在不同噪声环境下语音段检测的准确率,本发明提供一种基于EMD-Wavelet的MFCC相似度的语音段检测方法。该方法具有更好的鲁棒性和适应性,语音段检测的准确率更高,能够很好的应用于语音信号的语音段提取。
上述的目的通过以下技术方案实现,该方法包括如下步骤:
一种基于EMD-Wavelet的MFCC相似度的语音段检测方法,具体包括如下步骤:
步骤1,对人说话的语音信号进行测量,采集到的语音信号作为源信号;
步骤2,利用EMD对含噪的语音信号进行分解,得到体现语音信号高低频能量的的各阶本征模函数(IMF);
步骤3,求各阶本征模函数IMF的自相关系数,以自相关系数的方差确定噪声为主导模态的IMF阶数,对噪声为主导模态的IMF进行小波阈值降噪,把降噪后的低阶IMF分量和余下的高阶IMF分量进行重构,获得降噪后的语音信号;
步骤4,计算降噪后语音信号的Mel倒谱参数(MFCC),对比分析语音段和噪声段的参数特征,以欧氏距离作为语音信号MFCC相似度的测度;
步骤5,从相似度曲线中可明显区分语音段和非语音段,从而从语音信号中实现语音段的提取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811553681.9/2.html,转载请声明来源钻瓜专利网。