[发明专利]一种低信噪比环境下的端点检测方法在审
申请号: | 201910637142.1 | 申请日: | 2019-07-15 |
公开(公告)号: | CN110349598A | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 曾庆宁;卜玉婷;郑展恒 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L25/81;G10L25/84 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 覃永峰 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 端点检测 语音 倒谱系数 低信噪比 调制域 功率归一化 双门限判决 补偿相位 检测参数 特征参数 语音信号 噪声干扰 有效地 准确率 降噪 失真 噪声 检测 平衡 | ||
本发明公开了一种低信噪比环境下的端点检测方法,通过对带噪语音进行调制域谱减获得降噪和语音失真之间的平衡,从而改善语音质量,再结合功率归一化倒谱系数之间的距离进行端点检测,包括以下主要步骤:(一)对含噪语音进行调制域谱减并补偿相位得到增强后的语音;(二)提取经过调制域谱减后的语音信号的PNCC特征参数,计算每帧信号PNCC倒谱系数与噪声倒谱系数之间的倒谱距离;将倒谱距离作为检测参数,根据NIS帧的PNCC倒谱距离求出阈值,再采用双门限判决方法进行端点检测。本发明有效地解决了端点检测在低信噪比环境下性能急剧下降的问题,从而在噪声干扰较强的环境中实现较高的检测准确率。
技术领域
本发明涉及语音信号处理技术领域,尤其涉及一种低信噪比环境下的端点检测方法。
背景技术
端点检测(Endpoint Detection,ED),通常是指从背景噪声环境中区分出语音信号和非语音信号,并确定语音的起始点和结束点,又称为语音活动检测(Voice ActivityDetection,VAD)。随着智能家居的普及,语音技术的发展也备受关注,人们希望在更复杂的环境中也能用语音控制智能设备,因此研究低信噪比环境下高效的语音控制技术具有一定的实际价值。
端点检测是一种语音信号处理常用的前端处理技术,语音端点的准确定位有助于排除噪声段的干扰、增强系统处理的实时响应性、降低功耗从而提升系统性能。传统方法主要采用语音特征参数进行检测,主要有时域和频域两大类,其中时域常用的特征参数有短时能量、短时过零率、对数能量、短时相关性特征等;频域参数有谱熵、方差、倒谱距离、小波变换、经验模式分解(Empirical Mode Decomposition,EMD)等。端点检测的性能与语音和背景噪声之间的信噪比(Signal to Noise Ratio,SNR)密切相关,低信噪比环境下的端点检测一直是研究的热点之一。传统方法因侧重于对特征参数的提取而忽视了强噪声环境的干扰从而导致了端点检测在低信噪比环境下性能急剧下降。
发明内容
针对现有技术的不足,本发明所解决的技术问题是端点检测在低信噪比环境下性能急剧下降的问题。
为解决上述技术问题,本发明采用的技术方案是一种低信噪比环境下的端点检测方法,通过对带噪语音进行调制域谱减获得降噪和语音失真之间的平衡,从而改善语音质量,再结合功率归一化倒谱系数之间的距离进行端点检测,包括以下主要步骤:
(一)对含噪语音进行调制域谱减并补偿相位得到增强后的语音,具体分步骤如下:
(1)假设含噪语音由加性噪声和纯净语音组成,噪声和语音不相关,含噪信号可表示为:
y(n)=x(n)+d(n) (1)
其中x(n)为纯净信号,d(n)是噪声信号,n为离散时间域的索引位置;由于语音的短时平稳特性,故对信号y(n)进行分帧、加窗后做短时傅里叶变换:
(2)为了直观地表达出信号的幅度谱和相位谱,可将短时傅里叶变换后的频谱表示为极坐标形式:
Y(n,k)=|Y(n,k)|ej∠K(n,k) (3)
(3)在每个频率点沿时间逐帧对幅度谱|Y(n,k)|进行短时傅里叶变换得到调制谱:
上式表示为极坐标形式如下所示:
Y(τ,k,m)=|Y(τ,k,m)|ej∠Y(τ,k,m) (5)
τ是调制帧,m为调制频率,X(τ,k,m)和分别是纯净信号和噪声信号的调制谱;|Y(τ,k,m)|和∠Y(τ,k,m)分别为含噪语音的调制幅度谱和调制相位谱;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910637142.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音检测方法及装置
- 下一篇:音频播放方法及装置