[发明专利]一种麦克风阵列语音增强的优化方法无效

申请号：	201210127757.8	申请日：	2012-04-26
公开（公告）号：	CN102664023A	公开（公告）日：	2012-09-12
发明（设计）人：	王辉;张玲华	申请（专利权）人：	南京邮电大学
主分类号：	G10L21/02	分类号：	G10L21/02
代理公司：	南京经纬专利商标代理有限公司 32200	代理人：	艾中兰
地址：	210003 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种麦克风阵列语音增强优化方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种麦克风阵列语音增强的优化方法，其特征在于包含以下步骤：

第一步，前期处理，即完成对输入阵列语音信号进行预加重、分帧和加窗处理后，利用时延估计方法得到声源的方向信息，利用方向信息得到信号的导向矢量；

第二步，利用麦克风阵列搭建GSC结构模型，首先实现固定波束形成算法，有别于常规的GSC结构处理，它将FBF分成两部分：信号对齐和波束形成，首先利用前期处理得到的方向信息进行信号对齐，信号对齐是利用第一步中得到的导向矢量，将有方向时延的麦克风阵列信号变为从阵列法线方向输入信号，这样在理论上，麦克风阵列将从0°方向入射，将对齐后的信号分为两路，一路继续进行固定波束形成过程，累加求平均；另一路进入阻塞矩阵模块对目标信号进行阻塞；

第三步，实现阻塞矩阵模块，由于通过在第二步进行信号对齐，理论上信号方向为0°，在采用直线均匀阵时，阻塞矩阵采用如下形式：

其中B₀为阻塞矩阵，θ₀为阻塞方向，d为阵元间距，λ为声波波长，M为输入信号数，此时不论到达方向为何，初始θ₀都为0，通过阻塞矩阵后信号输入MC模块；

第四步，实现MC模块，理论上由FBF输出减去BM输出，将得到纯净的目标语音，这时考虑到发生方向估计错误时存在语音泄漏，MC的输出暂时不作为最终输出；

第五步，提取MC的输出，利用MC输出与BM输出之间的相关性，当相关函数较大时，存在泄漏语音，对相关函数值设定阈值，当超过阈值时，以θ₀为0作为初始参数，设定调整步长，以相关函数值减少为调整方向，通过倍乘方式调整参数，最终使相关函数值小于阈值，最后才在MC模块输出语音。

2.根据权利要求1所述的麦克风阵列语音增强的优化方法，其特征在于前期处理，具体过程如下：

第一步，对语音信号进行预处理，预加重系数为0.96，以16kHz采样，按512采样点分帧，帧移为50％，之后使用汉明窗进行加窗处理；

第二步，利用麦克风阵列接收信号，估计出信号方向信息，生成信号导向矢量。

3.根据权利要求1所述的麦克风阵列语音增强的优化方法，其特征在于搭建GSC模型，具体过程如下：

第一步，将FBF过程拆分为两个步骤，首先进行前期处理，利用所得到的信号导向矢量，对信号进行对齐补偿，使阵列接收的信号变为阵列法线方向，然后将对齐后的信号分为两路，一路输入BM模块，另一路继续进行固定波束形成过程，进行累加求平均，得到FBF输出；

第二步，根据阻塞矩阵设置，输入为所述对齐后的信号，经过信号与矩阵相乘，使阻塞矩阵阻塞估计目标方向上的信号，最后输出为除了目标方向的其他方向上的信号，将输出的M-1路信号合成为1路信号；

第三步，实现MC模块，将FBF输出减去BM的输出，即用包含目标信号与干扰的一路信号减去只含干扰的一路信号，最后只输出目标信号，在这里MC中采用自适应滤波器进一步减少其中存在的目标语音。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京邮电大学，未经南京邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210127757.8/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种麦克风阵列语音增强的优化方法无效

专利文献下载