[发明专利]一种用于麦克风阵列的解析式空间解混叠方法有效
申请号: | 201710068121.3 | 申请日: | 2017-02-07 |
公开(公告)号: | CN108398664B | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 应冬文;战鸽;黄兆琼;潘接林;颜永红 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | G01S5/18 | 分类号: | G01S5/18 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 王宇杨;陈琳琳 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 麦克风 阵列 解析 空间 解混叠 方法 | ||
本发明涉及一种用于麦克风阵列的解析式空间解混叠方法,包括:麦克风阵列接收声源信号,所述声源信号转换成数字声音信号;提取所述数字声音信号的频谱,得到麦克风阵列中每个麦克风的数字声音信号的频谱;根据每个麦克风的数字声音信号的频谱,估计每一个频点上的空间相关矩阵;对每一个频点上的空间相关矩阵进行分解,得到主特征向量,所述主特征向量的每个分量对应一个麦克风的采集信号;根据每个频点上的主特征向量,求取任意两个麦克风间的时间相位差;根据麦克风之间的时间相位差,通过解混叠公式求取周期数组合,进而从中找出最优的周期值。
技术领域
本发明涉及声源定位与语音增强领域,特别涉及一种用于麦克风阵列的解析式空间解混叠方法。
背景技术
基于麦克风阵列方法在语音信号处理中占据重要位置,它可用于远程会议,定位说话认的位置,为麦克风阵列指示波束聚焦的方向,为会议摄像头提供指向信息,同时可以分离和增强目标源信号。
在阵列处理中,经常需要根据信号的相位谱计算声源到达两个麦克风之间的时间延迟。然而相位是一个周期性变量,真实时间延迟是若干时间周期与相位时间差的加和。在麦克风间距足够大的情况下,周期数存在若干个取值可能,相位差与实践延迟之间存在一对多的关系,即周期发生了混叠。解混叠就是从多个候选的时间延迟中挑选出正确的周期数。
在现有的文献资料中,往往通过限制麦克风的间距,使其只有一个唯一的周期数取值可能,然而,小尺寸的麦克风阵列限制了阵列性能的发挥。还有一种方法是检验每一种周期取值的合理性,然而对于若干对麦克风组成的阵列,周期取值的组合可能是一个巨大的数字,容易导致巨大的计算量。
发明内容
本发明的目的在于克服周期混叠给时频分析技术带来的困扰,从而提供一种空间解混叠方法。
为了实现上述目的,本发明提供了一种用于麦克风阵列的解析式空间解混叠方法,包括:
步骤1)、麦克风阵列接收声源信号,所述声源信号转换成数字声音信号;
步骤2)、提取所述数字声音信号的频谱,得到麦克风阵列中每个麦克风的数字声音信号的频谱;
步骤3)、根据步骤2)得到的每个麦克风的数字声音信号的频谱,估计每一个频点上的空间相关矩阵;
步骤4)、对步骤3)所得到的每一个频点上的空间相关矩阵进行分解,得到主特征向量,所述主特征向量的每个分量对应一个麦克风的采集信号;
步骤5)、根据每个频点上的主特征向量,求取任意两个麦克风间的时间相位差;
步骤6)、根据麦克风之间的时间相位差,通过解混叠公式求取周期数组合,进而从中找出最优的周期值。
上述技术方案中,所述步骤2)包括:
步骤2-1)、缓存数字声音信号;
步骤2-2)、将数字声音信号中的各个帧都补零到N点,N=2j,j为整数,且j≥8;
步骤2-3)、对数字声音信号中补零到N点的各个帧做N点的快速傅里叶变换,得到一帧的数字化声音信号的离散频谱。
上述技术方案中,在步骤2-2)和步骤2-3)之间还包括对每一帧的数字声音信号进行预处理的步骤,所述的预处理包括:加窗和/或预加重处理。
上述技术方案中,所述步骤3)包括:
步骤3-1)、根据所有麦克风的数字化声音在各个频点上的傅里叶系数形成一复数向量,该复数向量的维度为麦克风的个数;
步骤3-2)、求取每个频点上的复数向量的复数自相关矩阵的均值估计。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710068121.3/2.html,转载请声明来源钻瓜专利网。