[发明专利]语音信号中冲激性噪声的去除方法有效
申请号: | 201910596190.0 | 申请日: | 2019-07-03 |
公开(公告)号: | CN110136739B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 雒瑞森;王琛;费绍敏;冯谦;郑海元;龚晓峰 | 申请(专利权)人: | 四川大学;成都大公博创信息技术有限公司 |
主分类号: | G10L21/0224 | 分类号: | G10L21/0224 |
代理公司: | 成都四合天行知识产权代理有限公司 51274 | 代理人: | 郭受刚;王记明 |
地址: | 610000 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信号 冲激 噪声 去除 方法 | ||
本发明公开了语音信号中冲激性噪声的去除方法,通过检测语音时域序列中的离群点来判断脉冲干扰点存在的位置,再通过比较中位数与脉冲干扰点的能量值大小来判定中位数是否可靠,当判定中位数受脉冲干扰污染后便舍弃该中位数,用它的左临近值代替中位数;当判定中位数符合要求时便用来替换该滑动窗口内原中心值。通过对比处理前后该语音段的波形图发现,原始带噪语音含有很多尖峰脉冲,即冲激性噪声,经由步骤一至步骤七处理后,明显的波形图更加平滑了,尖峰脉冲被平滑掉了,从而得知经本方法滤波后,有效的去除了该语音段中的冲激性噪声,得到新的语音时域序列。
技术领域
本发明涉及语音去噪技术,具体涉及语音信号中冲激性噪声的去除方法。
背景技术
无线电电磁频谱管控是经济生产及安全防范中的重要内容,由于无线电广播技术自身的开放性,所有有发射需求的用户,只需要占据特定的频段,即可通过发射信号进行广播。因此,时常有出于不同目的用户,在批准发射的频率之外,擅自占据频段进行广播发射,俗称“黑广播”。黑广播主要以售卖假冒伪劣产品居多,严重扰乱经济秩序;或者是扰乱正常电子通讯的运转;某些情况下甚至会干扰关键性通讯设备,引发严重的安全隐患。因此,进行有效的无线电电磁频谱管控,是一件意义重大的课题。传统的无线电电磁频谱管控,主要是基于人工收听并识别的方法,具有成本高、效率低、操作人员疲劳易引发失误等缺点;随着人工智能的发展,采用人工智能技术来识别黑广播的方法也开始进入研究,但是,由于广播通常对音质没有过高要求,所以广播录音通常噪声很大,比如电流杂音、外界环境声音、说话者语气词等。对广播录音进行关键词的识别得到的结果准确率很低、误识率较高。
在去除录音信号中的冲激性噪声方面,传统的中值滤波的做法是在滑动窗口内对中心值和周围的其他所有值进行排序,得到一个中间值,以该中位数直接来替换掉原中心值,它是一种非线性的图像平滑法,它对脉冲干扰级椒盐噪声的抑制效果好,在抑制随机噪声的同时能有效保护边缘少受模糊。但是如果语音中某一段内出现高密度脉冲干扰,这样在该区域滑动窗口内的中位数会受到污染,进而导致滤波不够彻底,导致广播录音信号中的冲激性噪声不能被彻底的去除。
发明内容
本发明目的在于解决语音中某一段内出现高密度脉冲干扰时,传统中值滤波法滤波过程中滑动窗口内的中位数会受到污染,进而导致滤波不够彻底的问题,提供了语音信号中冲激性噪声的去除方法,通过先检测用来替换的中位数是否受到污染,如受到污染用左临近值代替受脉冲干扰污染后中位数的方法;可以更有效的去除语音段中的冲激性噪声。
本发明通过下述技术方案实现:
语音信号中冲激性噪声的去除方法,包括以下步骤:
步骤一、对含有普通话的待处理语音段进行分帧,得到分帧后的语音时域序列Yi(n),i=0,1,2,…N-1,N表示帧数;
步骤二、根据步骤一中分帧后的待处理语音段建立滑动窗口S(z),z=0、1、2…、Z,Z为窗口大小;
步骤三、将该滑动窗口S(z)沿步骤一得到的语音时域序列Yi(n)方向进行滑动;初始时z值为0,每移动一次滑动窗口S(z),z值加1;
步骤四、每次移动后,定义当前窗口内的语音时域序列段为Yi,j(n),对窗口内语音时域序列段Yi,j(n)求差分序列gi,j(n);i表示在第i帧内,j表示在该帧的第j个采样点;
步骤五、找到各个窗口的差分序列gi,j(n),通过差分序列gi,j(n)找到含有离群点的窗口并求出这些窗口内的离群点gi,out;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学;成都大公博创信息技术有限公司,未经四川大学;成都大公博创信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910596190.0/2.html,转载请声明来源钻瓜专利网。