[发明专利]一种基于Kullback-Leibler差异的语音增强方法有效
申请号: | 201811246250.8 | 申请日: | 2018-10-25 |
公开(公告)号: | CN109346097B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 王慧;黄青华;张丽丽;柯晨光 | 申请(专利权)人: | 上海大学 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L25/27 |
代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 陆聪明 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 kullback leibler 差异 语音 增强 方法 | ||
1.一种基于Kullback-Leibler差异的语音增强方法,其特征在于,包括以下步骤:
1)、对含有噪声的语音信号进行分帧,将每一帧信号看作稳态信号;
2)、对处理后的每一帧语音信号分别进行分析处理,利用KL差异选择原理依次选出最佳的原子a1,a2,...ak,用选出的最佳原子计算有理正交基函数Bk,然后用权重系数与该基函数组合得到增强后的重构信号;
3)、将N次分解后得到的重构信号叠加得到增强后的纯净语音信号;
4)、根据代价函数得到最佳分解次数;
上述步骤2)中所述的根据KL差异选择原则选出最佳原子并重构每次分解的增强信号,具体步骤如下:
对于含有噪声的原始语音信号f(t)表示为如下形式:
f(t)=s(t)+n(t) (1)
其中,s(t)为纯净语音信号,即需要重构得到的信号,n(t)为噪声信号,以下用f替代f(t);
对于第一次分解,令f1=f,分解后得到重构信号表示为:
其中
为点ak的L2单位模化了的核,ak为模小于1的原子,<f1,e{a1}(z)>表示内积,z为单位圆的边界,其模为1;R1为第二阶标准误差,进一步写成:
根据公式(2)和(4),f2表示为:
f2即作为第二次分解时的输入信号,并对f2重复上述分解过程得到重构信号:
以此类推,经过第k次分解后,重构信号写为:
其中Bk(z)即为有理正交基函数,表示为:
从公式(7)和(8)看出,该分解算法的核心是选取最佳的原子ak;在每一次分解中,利用KL差异选择原理来选取最佳原子,KL差异的定义为:
其中yi为原始信号,为重构信号,M为信号长度;KL差异是衡量两个信号之间相似程度的重要标准,从公式(9)看出DKL值越小,两个信号越相似,表明重构出的信号越逼近原始信号;所以,在每一次分解后求解重构信号与原始信号的KL差异值并寻找使得该值最小的原子,即:
其中C为能够选择原子的集合,即:
Δm是等间隔划分区间(-1,1)的步长;
至此,已经选取出了最佳的原子,之后利用这些最佳原子重构出增强后的信号;通常情况下,取公式(7)右边的前半部分作为重构信号,舍弃后半部分的标准误差,每次分解后的重构信号用如下形式表示:
基函数与权重系数组合得到的重构信号如公式(12)所示,权重系数即为接下来将N次分解后的重构信号叠加即得到最终增强后的纯净语音信号,其公式表示为:
上述步骤4)中所述的根据代价函数得到最佳分解次数,其具体如下:
在步骤2)、3)中另一个关键因素就是分解次数的选择,次数过少会导致降噪效果不理想,次数过多又会导致过大的计算量;因此,用代价函数来确定最佳的分解次数;
均方根误差是观测值与真实值偏差的平方和观测次数比值的平方根,它能够很好的反映出测量的精密程度,其定义如下:
其中n为数据长度;
利用每次分解的RMSE衰减差值作为代价函数确定最佳分解次数,即:
其中i表示分解次数;由公式(14)得出RMSE越小,信号重构越精确,所以当ΔRi小于0时,则表明重构越接近原始信号;因此,使信号持续分解直到ΔRi大于0则停止分解,此时的分解次数i即为最佳分解次数,此时得到的重构信号也是最纯净的语音信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811246250.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于语音识别过程的回声消除方法及装置
- 下一篇:一种回声消除方法及终端