[发明专利]一种麦克风阵列语音增强的优化方法无效
| 申请号: | 201210127757.8 | 申请日: | 2012-04-26 |
| 公开(公告)号: | CN102664023A | 公开(公告)日: | 2012-09-12 |
| 发明(设计)人: | 王辉;张玲华 | 申请(专利权)人: | 南京邮电大学 |
| 主分类号: | G10L21/02 | 分类号: | G10L21/02 |
| 代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 艾中兰 |
| 地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 麦克风 阵列 语音 增强 优化 方法 | ||
技术领域
本发明涉及语音增强技术,特别涉及麦克风阵列语音增强,属于语音信号处理技术领域。
背景技术
语音增强一直是语音信号处理领域的研究热点,麦克风阵列处理的引入提供了一条新的途径来进行语音增强。麦克风阵列不仅提供了信号在时域和频域上的信息,还提供了一个空间域,对来自空间不同方向的信号进行空时频联合处理,它以天线阵列的算法为理论依据,结合单通道语音处理的方法,用空间滤波器的方式,提供声源信号空间位置,达到滤取声源信号的同时抑制干扰信号的目的。
语音增强的目标是在保证在不损坏目标语音结构的前提下,减少甚至消除接受信号中存在的噪声,从而提高语音的清晰度。
麦克风阵列语音增强的实现可以分为声源定位阶段和语音增强阶段。在声源定位阶段,系统获取说话人的空间上的方位信息;在语音增强阶段,利用已获得的方位信息,采用阵列信号处理方法,滤取声源方向的信息,抑制其他方向上的干扰信息,实现语音增强。
麦克风阵列语音增强结合阵列处理技术,经过大量的研究,目前主要形成了三种主流算法:固定波束形成法、自适应波束形成法和后置滤波器的波束形成法。其中GSC(Generalized Sidelobe Canceller,广义旁瓣抵消器)结构的自适应波束形成法凭借低计算量高性能,因此广为应用。但是采用阵列处理最容易出现的问题是,当出现目标信号方向估计误差时,容易造成目标信号的泄漏,严重影响语音增强的性能。在GSC结构中,主要构造模块为BM(Blocking Matrix,阻塞矩阵)模块,它能够利用估计出的方向信息,滤除目标方向信号,所以对麦克风阵列语音增强算法的优化重点在于阻塞矩阵的优化。
发明内容
本发明的目的在于提供一种麦克风阵列语音增强算法的优化方法,提高阻塞矩阵的适应能力,使阻塞矩阵泄漏的语音减小,提高语音增强的鲁棒性。
实现本发明目的的技术解决方案为:一种麦克风阵列语音增强的优化方法,步骤如下:
第一步,前期处理,即完成对输入阵列语音信号进行预加重、分帧和加窗处理后,利用时延估计方法得到声源的方向信息,利用方向信息得到信号的导向矢量;
第二步,利用麦克风阵列搭建GSC结构模型,首先实现固定波束形成算法,有别于常规的GSC结构处理,它将FBF分成两部分:信号对齐和波束形成,首先利用前期处理得到的方向信息进行信号对齐,信号对齐是利用前述中得到的导向矢量,将有方向时延的麦克风阵列信号变为从阵列法线方向输入信号,这样在理论上,麦克风阵列将从0°方向入射,将对齐后的信号分为两路,一路继续进行固定波束形成过程,进行累加求平均;另一路进入阻塞矩阵模块对目标信号进行阻塞;
第三步,实现阻塞矩阵模块,由于通过在第二步进行信号对齐,理论上信号方向为
0°,在采用直线均匀阵时,阻塞矩阵采用如下形式;
其中为阻塞矩阵,为阻塞方向即信号估计方向,d为阵元间距,为声波波长,M为输入信号数,此时不论到达方向为何,初始都为0,通过阻塞矩阵后信号输入MC模块;
第四步,实现MC(Multiple-input Canceller,多输入抵消器)模块,理论上由FBF(Fixed BeamFomer,固定波束形成器)输出减去BM输出,将得到纯净的目标语音,这时考虑到发生方向估计错误时存在语音泄漏,MC的输出暂时不作为最终输出;
第五步,提取MC的输出,利用MC输出与BM输出之间的相关性,当相关函数较大时,存在泄漏语音,对相关函数值设定阈值,当超过阈值时,以为0作为初始参数,设定调整步长,以相关函数值减少为调整方向,通过倍乘方式调整参数,最终使相关函数值小于阈值,最后才在MC模块输出语音。
本发明与现有技术相比,其优点在于:削弱了方向估计误差对麦克风阵列语音增强的影响,提高自适应波束形成器的鲁棒性。使阻塞矩阵指向的方向收敛于真实方向,减少目标语音泄漏,提高输出语音的输出信噪比和清晰度,克服GSC结构的波束形成器过度依赖目标信号方向估计的弱点。
下面结合附图对本发明作进一步详细描述。
附图说明
图1是本发明中GSC结构麦克风阵列语音增强算法示意图。
具体实施方式
结合图1,本发明GSC结构的麦克风阵列语音增强优化方法,步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210127757.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于传动机构的同步单元
- 下一篇:同步器





