[发明专利]一种用于分布式麦克风阵列的声源定位系统及定位方法有效
申请号: | 201310379053.4 | 申请日: | 2013-08-27 |
公开(公告)号: | CN103439688A | 公开(公告)日: | 2013-12-11 |
发明(设计)人: | 喆;殷福亮;王舒文 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G01S5/20 | 分类号: | G01S5/20 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 李洪福 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于分布式麦克风阵列的声源定位系统及其定位方法,所述的系统包括信号能量比计算模块A、数据库建立模块、GMM训练模块、信号能量比计算模块B和声源坐标计算模块;信号能量比计算模块A的输出端与数据库建立模块输入端连接;数据库建立模块输出端与GMM训练模块输入端连接,GMM训练模块输出端与声源坐标计算模块输入端连接;信号能量比计算模块B的输出端也与声源坐标计算模块输入端连接;声源坐标计算模块输出端输出声源坐标。由于本发明采用麦克风接收信号能量作为主要参数,仅与该麦克风和声源间的距离有关,故无需考虑阵列几何结构与尺寸信息,也无需考虑声音信号传输延迟时间、平稳性、宽带或窄带等因素。 | ||
搜索关键词: | 一种 用于 分布式 麦克风 阵列 声源 定位 系统 方法 | ||
【主权项】:
1.一种用于分布式麦克风阵列的声源定位系统,其特征在于:包括信号能量比计算模块A、数据库建立模块、GMM训练模块、信号能量比计算模块B和声源坐标计算模块;所述的信号能量比计算模块A的输入端输入指纹采集点处各麦克风采集到的信号,输出端与数据库建立模块输入端连接;数据库建立模块输出端与GMM训练模块输入端连接,GMM训练模块输出端与声源坐标计算模块输入端连接;所述的信号能量比计算模块B的输入端输入未知位置处各麦克风采集到的信号,输出端也与声源坐标计算模块输入端连接;声源坐标计算模块输出端输出声源坐标;所述的GMM为高斯混合模型Gaussian Mixture Model的简称;信号能量比计算模块A根据在各个指纹采集点处采集到的信号生成训练矢量,数据库建立模块将该训练矢量存储起来构成数据库,GMM训练模块根据数据库中的数据进行训练,获得GMM参数,该参数供声源坐标计算模块使用;信号能量比计算模块B采集未知位置的信号生成观测矢量,声源坐标计算模块根据该矢量和GMM参数计算出该未知位置处的声源坐标;一种用于分布式麦克风阵列的声源定位方法,包括以下步骤:A、在已部署好的麦克风阵列工作场地,将声源移动至事先确定好的各个指纹采集点处,将采集到的信号输入到信号能量比计算模块A,进行信号能量比计算,输出计算结果至数据库建立模块;所述的信号能量比计算对每个指纹采集点处采集的每帧信号进行一次计算;所述的信号能量比计算模块A的工作方法包括以下步骤:首先检测输入信号的有效性,定义分布式麦克风阵列中麦克风数目为M,第1个麦克风接收到的输入为s1(n),当前帧在原始信号序列中的起始位置为start,信号帧长为L=qfs,qfs为信号采样频率,q为帧长对应的等效时间,其取值范围是0.05<q<0.5;则第1个麦克风的当前帧短时对数能量E1为E 1 = Σ n = start start + L - 1 s 1 2 ( n ) ]]> 将E1与信号/噪声判定阈值Ethr进行比较,若E1<Ethr,判定当前帧为噪声帧,否则,判定当前帧为信号帧;若当前帧为噪声帧,则估计背景噪声能量并更新阈值Ethr;更新阈值Ethr的方法为ifEmin<E1Emin=E1Ethr=aEminend if其中,Emin表示记录的第1个麦克风最小短时能量,a为一个门限因子,其取值范围1<a<100;定义第m个麦克风接收到输入为sm(n),若当前帧为噪声帧,则第m个麦克风的背景噪声Em估计方法为E m = Σ n = start start + N - 1 s m 2 ( n ) , m = 1,2 , · · · , M ]]> εm,curr=(1-b)·εm,old+b·Em其中,εm,curr为第m个麦克风当前帧背景噪声能量估计值,εm,old为第m个麦克风前一次背景噪声能量估计值,b为平滑因子,表示平滑过程中当前帧能量Em所占比重,其取值范围0<b<1;若当前帧为信号帧,去除第1个和第m个麦克风背景噪声能量的影响,之后以第1个麦克风信号能量作参考,计算第m个麦克风与第1个麦克风的修正后的信号能量比erm,er m = E m - ϵ m , curr E 1 - ϵ 1 ]]> 然后将erm,m=2,3,…,M,共M-1个信号能量比组成能量比矢量ER,即ER=[er2,er3,…,erM]TB、将信号能量比计算模块A计算得到的信号能量比以及对应指纹采集点坐标输入到数据库建立模块,并将其存储起来用于建立数据库,数据库建立模块只需离线执行一次,GMM训练模块输出的GMM参数输出至声源坐标计算模块;所述的数据库建立模块的工作方法包括以下步骤:将声源移动到事先确定好的各个指纹采集点处,为保证有足够多的训练用矢量,降低指纹参数的随机误差,需在每个采集点多次计算输入信号能量比,并将能量比矢量与对应采集点坐标依次记录下来;设置一个平面区域,将每个能量比矢量ERi与对应采集点坐标SLi组成联合矢量,存储至数据库,即x i = ER i SL i - - - ( 6 ) ]]> 其中,i=1,2…,N,N表示数据库中共有N组数据;C、将数据库中的数据输入到GMM训练模块,将其作为训练矢量,训练GMM,输出GMM参数至声源坐标计算模块,在数据库不变的情况下,GMM训练模块只需离线执行一次;所述的GMM训练模块的工作过程如下:GMM用多个高斯分布函数的组合逼近任意形状的概率分布;假设GMM中具有K个高斯混合分量,那么对于D维的观测矢量xi,其联合概率分布表示为p ( x i ; Θ ) = Σ k = 1 K w k f k ( x i ; μ k , Σ k ) - - - ( 7 ) ]]> 其中,wk是第k个高斯分量的权值,满足
fk(xi;μk,Σk)为D维高斯概率分布函数,表达式为f k ( x i ; μ k , Σ k ) = 1 ( 2 π ) D / 2 | Σ k | 1 / 2 exp [ - 1 2 ( x i - μ k ) T Σ k - 1 ( x i - μ k ) ] - - - ( 8 ) ]]> 其中,μk是第k个高斯分量的均值矢量,Σk是第k个高斯分量的协方差矩阵,而
表示全部高斯混合分量的参数,也就是整个GMM的参数;对于含有N组观测数据的数据集X=[x1,x2,…,xN],其对数似然函数表示为log e p ( X ; Θ ) = Σ i = i N log e p ( x i ; Θ ) - - - ( 9 ) ]]> 用数据集X来训练GMM,就是找到一组参数Θ,使得对数似然函数logep(X;Θ)的期望最大,求解这一组参数采用的是期望最大化算法,即EM算法;EM算法是一种迭代算法,主要包括两个步骤:求期望的EXPECT步骤和最大化的MAXIMIZE步骤;对于GMM,其具体过程如下:C1、采用K均值聚类方法确定参数初始值
C2、求期望步骤,即EXPECT步骤:求训练数据集中第i个数据在第k个高斯分量状态下的概率p ( k i = k ; x i , Θ ( 0 ) ) = w k ( 0 ) f k ( x i ; μ k ( 0 ) , Σ k ( 0 ) ) Σ j = 1 K w j ( 0 ) f j ( x i ; μ j ( 0 ) , Σ j ( 0 ) ) - - - ( 10 ) ]]> C3、最大化步骤,即MAXIMAZE步骤:求使logep的期望取最大值的Θ:各混合分量的均值矢量、方差以及权值,即μ k ( 1 ) = Σ i = 1 N p ( k i = k ; x i , Θ ( 0 ) ) x i Σ i = 1 N p ( k i = k ; x i , Θ ( 0 ) ) - - - ( 11 ) ]]>Σ k ( 1 ) = Σ i = 1 N p ( k i = k ; x i , Θ ( 0 ) ) ( x i - μ k ( 1 ) ) ( x i - μ k ( 1 ) ) T Σ i = 1 N p ( k i = k ; x i , Θ ( 0 ) ) - - - ( 12 ) ]]>w k ( 0 ) = 1 N Σ i = 1 N p ( k i = k ; x i , Θ ( 0 ) ) - - - ( 13 ) ]]> 其中,上角标数字表示当前迭代次数;C4、重复步骤C2和C3,直到达到收敛条件,迭代停止;由此估计得到GMM参数
从而建立GMM;D、在线定位阶段,声源处于某个未知位置,将采集到的信号输入到信号能量比计算模块B,进行信号能量比计算,输出计算结果至声源坐标计算模块,信号能量比计算每帧执行一次;所述的信号能量比计算模块B的工作过程与信号能量比计算模块A的工作过程相同;E、将GMM参数与信号能量比计算模块B输出的信号能量比输入到声源坐标计算模块,进行声源坐标的计算,输出声源坐标;所述的声源坐标计算模块的工作过程如下:高斯混合回归是一种多变量非线性回归模型,其在对数据的联合概率密度构造GMM之后,导出条件概率密度和回归函数;对于联合矢量ER i SL i , ]]> 由训练GMM模块训练所得GMM参数可构成其联合概率密度:p ( ER , SL ) = Σ k = 1 K w k f k ( ER , SL ; μ k , Σ k ) ]]>= Σ k = 1 K w k f k ( SL | ER ; m k ( ER ) , σ k 2 ) f k ( ER ; μ kE , Σ kEE ) ]]> (14)式中Σ k = 1 K w k = 1 , μ k = μ kE μ kS , Σ k = Σ kEE Σ kES Σ kSE Σ kSS - - - ( 15 ) ]]>m k ( ER ) = μ kS + Σ kSE Σ kEE - 1 ( ER - μ kE ) - - - ( 16 ) ]]>σ k 2 = Σ kSS - Σ kSE Σ kEE - 1 Σ kES - - - ( 17 ) ]]> 其中,ER表示能量比矢量,SL表示与之对应的采集点坐标,ER|SL表示在SL采集点处采集得能量比为ER的情况;μkE与μkS分别表示ER和SL在第k个高斯分量上的均值矢量,ΣkEE和ΣkSS分别表示ER和SL在第k个高斯分量上的自相关矩阵;ΣkES和ΣkSE分别表示ER和SL、SL和ER在第k个高斯分量上的协方差矩阵;mk(ER)表示ER的期望,
表示方差;计算边缘密度p ( ER ) = Σ k = 1 K w k f k ( ER ; μ kE , Σ kEE ) - - - ( 18 ) ]]> 得到条件概率密度p ( SL | ER ) = p ( ER , SL ) p ( ER ) = Σ k = 1 K w k f k ( ER ; μ kE , Σ kEE ) Σ k = 1 K w k f k ( ER ; μ kE , Σ kEE ) f k ( SL | ER ; m k ( ER ) , σ k 2 ) - - - ( 19 ) ]]> 根据式(19),在已知观测矢量ER′的情况下,计算其条件概率期望m(ER′),得到声源坐标估计值
即S ^ L = m ( ER ′ ) = E [ SL | ER = ER ′ ] = Σ k = 1 K w k f k ( E R ′ ; μ kE , Σ kEE ) Σ k = 1 K w k f k ( E R ′ ; μ kE , Σ kEE ) m k ( ER ′ ) - - - ( 20 ) . ]]>
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310379053.4/,转载请声明来源钻瓜专利网。
- 上一篇:具有进气孔的吸尘器风动地刷
- 下一篇:架杆式双面玻璃擦