[发明专利]一种基于Kullback-Leibler差异的语音增强方法有效

申请号：	201811246250.8	申请日：	2018-10-25
公开（公告）号：	CN109346097B	公开（公告）日：	2023-07-14
发明（设计）人：	王慧;黄青华;张丽丽;柯晨光	申请（专利权）人：	上海大学
主分类号：	G10L21/0208	分类号：	G10L21/0208;G10L25/27
代理公司：	上海上大专利事务所(普通合伙) 31205	代理人：	陆聪明
地址：	200444***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 kullback leibler 差异语音增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于Kullback‑Leibler(KL)差异的语音增强方法并且确定该方法的最佳分解次数：具体是先将含噪语音信号做分帧处理，并对每一帧信号分别处理，利用KL差异原理选出最佳原子；根据这些原子构造出最佳有理正交基，并与权重系数组合得到重构信号；接着将N次分解得到的重构信号叠加得到最终降噪后的语音信号；最后，利用RMSE衰减差值作为代价函数确定最佳分解次数。本方法利用KL差异选择原则，自适应的选出最佳原子并构造基函数，极大的降低了人为选择参数导致不确定性的缺陷，在低信噪比时有更好的降噪性能。其次，根据代价函数确定最佳分解次数，有效降低了计算复杂度。该方法可广泛应用于语音降噪等领域。

技术领域

本发明涉及一种基于Kullback-Leibler(KL)差异的语音增强方法，应用于无线电话通信、场景录音和军事窃听等技术领域。

背景技术

语音信号处理的目的是要得到某些语音特征参数以便高效的传输或存储，或者是通过某种处理运算可以达到某种用途的要求，例如人工语音合成、辨别出讲话者，讲话的内容等。语音增强是语音信号处理的一个重要方面。语音增强的一个主要目的是从混杂着噪声的语音信号中尽可能地提取出纯净的原始语音信号，然而，由于在通常情况下干扰都是随机的，从混杂着噪声的语音信号中提取出完全纯净的语音信号几乎是不可能的，尤其是在低信噪比的情况下更是十分困难。在这种情况下，语音增强的目的主要有两个：一是改进语音质量，消除背景噪声，使听者乐于接受；二是，提高语音的可懂度，使说话人易于辨识。

近年来语音增强算法层出不穷，也得到了普遍的应用。这些方法主要是利用语音信号的某些特性，对其参数进行相关处理以达到消除噪声，逼近纯净语音信号的功能。现有已经提出来的语音增强方法主要包括：傅里叶变换及在其基础上衍生出来的短时傅里叶变换、小波变换。

传统的傅里叶变换去噪方法是将一个信号分离为无穷多正弦信号的叠加。它将含有噪声的语音信号从时域变换到频域，然后对频域信号进行相关处理，用滤波器将噪声信号的频率进行滤除，保留剩余成分，然后对其做傅里叶逆变换便得到降噪后的语音信号。但是傅里叶变换对信号的要求十分严格，通常它只能对线性平稳的信号有较好的处理效果，而语音信号一般都是非线性和非平稳的，因此得不到理想的降噪效果。

为了克服傅里叶变换不适合于非线性非稳定信号的缺点，衍生出了短时傅里叶变换的方法。短时傅里叶变换是常用的一种时频分析方法。它主要是通过对语音信号加上窗函数来使非平稳信号在一段时间内变的相对平稳，之后对加窗后的分段信号分别做傅里叶变换，方法同传统的傅里叶变换方法一致。在短时傅里叶变换过程中，窗的长度决定了频谱图的时间分辨率和频率分辨率，窗越长，截取的信号越长，傅里叶变换后频率分辨率越高，时间分辨率越差；相反，窗越短，截取的信号越短，变换后的频率分辨率越差，时间分辨率越好。测不准原理指出：不可能在时间和频率两个空间同时以任意精度逼近被测信号，因此在信号处理时必须对时间或频率精度进行取舍。所以，在短时傅里叶变换进行降噪过程中，频率分辨率和时间分辨率不能兼得。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海大学，未经上海大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811246250.8/2.html，转载请声明来源钻瓜专利网。

上一篇：一种用于语音识别过程的回声消除方法及装置
下一篇：一种回声消除方法及终端

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于Kullback-Leibler差异的语音增强方法有效

专利文献下载