[发明专利]一种麦克风阵列语音增强的优化方法无效

专利信息
申请号: 201210127757.8 申请日: 2012-04-26
公开(公告)号: CN102664023A 公开(公告)日: 2012-09-12
发明(设计)人: 王辉;张玲华 申请(专利权)人: 南京邮电大学
主分类号: G10L21/02 分类号: G10L21/02
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 艾中兰
地址: 210003 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 麦克风 阵列 语音 增强 优化 方法
【权利要求书】:

1.一种麦克风阵列语音增强的优化方法,其特征在于包含以下步骤:

第一步,前期处理,即完成对输入阵列语音信号进行预加重、分帧和加窗处理后,利用时延估计方法得到声源的方向信息,利用方向信息得到信号的导向矢量;

第二步,利用麦克风阵列搭建GSC结构模型,首先实现固定波束形成算法,有别于常规的GSC结构处理,它将FBF分成两部分:信号对齐和波束形成,首先利用前期处理得到的方向信息进行信号对齐,信号对齐是利用第一步中得到的导向矢量,将有方向时延的麦克风阵列信号变为从阵列法线方向输入信号,这样在理论上,麦克风阵列将从0°方向入射,将对齐后的信号分为两路,一路继续进行固定波束形成过程,累加求平均;另一路进入阻塞矩阵模块对目标信号进行阻塞;

第三步,实现阻塞矩阵模块,由于通过在第二步进行信号对齐,理论上信号方向为0°,在采用直线均匀阵时,阻塞矩阵采用如下形式:

其中B0为阻塞矩阵,θ0为阻塞方向,d为阵元间距,λ为声波波长,M为输入信号数,此时不论到达方向为何,初始θ0都为0,通过阻塞矩阵后信号输入MC模块;

第四步,实现MC模块,理论上由FBF输出减去BM输出,将得到纯净的目标语音,这时考虑到发生方向估计错误时存在语音泄漏,MC的输出暂时不作为最终输出;

第五步,提取MC的输出,利用MC输出与BM输出之间的相关性,当相关函数较大时,存在泄漏语音,对相关函数值设定阈值,当超过阈值时,以θ0为0作为初始参数,设定调整步长,以相关函数值减少为调整方向,通过倍乘方式调整参数,最终使相关函数值小于阈值,最后才在MC模块输出语音。

2.根据权利要求1所述的麦克风阵列语音增强的优化方法,其特征在于前期处理,具体过程如下:

第一步,对语音信号进行预处理,预加重系数为0.96,以16kHz采样,按512采样点分帧,帧移为50%,之后使用汉明窗进行加窗处理;

第二步,利用麦克风阵列接收信号,估计出信号方向信息,生成信号导向矢量。

3.根据权利要求1所述的麦克风阵列语音增强的优化方法,其特征在于搭建GSC模型,具体过程如下:

第一步,将FBF过程拆分为两个步骤,首先进行前期处理,利用所得到的信号导向矢量,对信号进行对齐补偿,使阵列接收的信号变为阵列法线方向,然后将对齐后的信号分为两路,一路输入BM模块,另一路继续进行固定波束形成过程,进行累加求平均,得到FBF输出;

第二步,根据阻塞矩阵设置,输入为所述对齐后的信号,经过信号与矩阵相乘,使阻塞矩阵阻塞估计目标方向上的信号,最后输出为除了目标方向的其他方向上的信号,将输出的M-1路信号合成为1路信号;

第三步,实现MC模块,将FBF输出减去BM的输出,即用包含目标信号与干扰的一路信号减去只含干扰的一路信号,最后只输出目标信号,在这里MC中采用自适应滤波器进一步减少其中存在的目标语音。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210127757.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top