[发明专利]语音信号中冲激性噪声的去除方法有效
申请号: | 201910596190.0 | 申请日: | 2019-07-03 |
公开(公告)号: | CN110136739B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 雒瑞森;王琛;费绍敏;冯谦;郑海元;龚晓峰 | 申请(专利权)人: | 四川大学;成都大公博创信息技术有限公司 |
主分类号: | G10L21/0224 | 分类号: | G10L21/0224 |
代理公司: | 成都四合天行知识产权代理有限公司 51274 | 代理人: | 郭受刚;王记明 |
地址: | 610000 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了语音信号中冲激性噪声的去除方法,通过检测语音时域序列中的离群点来判断脉冲干扰点存在的位置,再通过比较中位数与脉冲干扰点的能量值大小来判定中位数是否可靠,当判定中位数受脉冲干扰污染后便舍弃该中位数,用它的左临近值代替中位数;当判定中位数符合要求时便用来替换该滑动窗口内原中心值。通过对比处理前后该语音段的波形图发现,原始带噪语音含有很多尖峰脉冲,即冲激性噪声,经由步骤一至步骤七处理后,明显的波形图更加平滑了,尖峰脉冲被平滑掉了,从而得知经本方法滤波后,有效的去除了该语音段中的冲激性噪声,得到新的语音时域序列。 | ||
搜索关键词: | 语音 信号 冲激 噪声 去除 方法 | ||
【主权项】:
1.语音信号中冲激性噪声的去除方法,其特征在于,包括以下步骤:步骤一、对含有普通话的待处理语音段进行分帧,得到分帧后的语音时域序列Yi(n),i=0,1,2,…N‑1,N表示帧数;步骤二、根据步骤一中分帧后的待处理语音段建立滑动窗口S(z),z=0、1、2…、Z,Z为窗口大小;步骤三、将该滑动窗口S(z)沿步骤一得到的语音时域序列Yi(n)方向进行滑动;初始时z值为0,每移动一次滑动窗口S(z),z值加1;步骤四、每次移动后,定义当前窗口内的语音时域序列段为Yi,j(n),对窗口内语音时域序列段Yi,j(n)求差分序列gi,j(n);i表示在第i帧内,j表示在该帧的第j个采样点;步骤五、找到各个窗口的差分序列gi,j(n),通过差分序列gi,j(n)找到含有离群点的窗口并求出这些窗口内的离群点gi,out;步骤六、分别对含有离群点窗口中的各个离群点gi,out进行排序,找出各自窗口中离群点gi,out的绝对值最大的点max{gi,out},用各自窗口中的绝对值最大离群点max{gi,out}与原语音时域序列Yi(n)对应位置相加即可求出其对应窗口中该点的语音时域序列值Yi,max out(n),即语音冲激值;步骤七、针对含有离群点的窗口,求出各自窗口内所有点的语音时域序列值Yi,out(n)并进行排序,求各自窗口内语音时域序列值Yi,out(n)的中位数Yi,med(n),在各自窗口内比较冲激值Yi,max out(n)与中位数Yi,med(n)的大小;若语音冲激值Yi,max out(n)大于中位数Yi,med(n)则中位数Yi,med(n)可靠,用该中位数Yi,med(n)替换该窗口内的中心值;若语音冲激值Yi,max out(n)小于中位数Yi,med(n)则中位数Yi,med(n)不可靠,用中位数Yi,med(n)的左临近值Yi,med left(n)替换该窗口内的中心值;得到新的语音时域序列Yi(n)'。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学;成都大公博创信息技术有限公司,未经四川大学;成都大公博创信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910596190.0/,转载请声明来源钻瓜专利网。