[发明专利]一种基于时延补偿和双耳一致性的双耳声音源定位方法有效
申请号: | 201410142777.1 | 申请日: | 2014-04-10 |
公开(公告)号: | CN103901400A | 公开(公告)日: | 2014-07-02 |
发明(设计)人: | 刘宏;张结;丁润伟 | 申请(专利权)人: | 北京大学深圳研究生院 |
主分类号: | G01S5/18 | 分类号: | G01S5/18 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 余长江 |
地址: | 518055 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 补偿 一致性 声音 定位 方法 | ||
1.一种基于时延补偿和双耳一致性的双耳声音源定位方法,包括:
1)训练阶段,录制双耳声音源定位数据库,为双耳时间差和双耳能量差建立模板,包括:
1‐1)将定位空间按照转向角和俯仰角划分;
1‐2)采用固定声源到坐标系中心距离,在室内/半室内安静环境中分别为定位空间划分后的每个方向录制声音数据;
1‐3)基于时延补偿的方法离线为每个方向上的双耳时间差、双耳能量差,以及各自的期望和方差建立模板;
2)在线定位阶段,当声源定位系统检测到有声音源发生,先对录入的声音源信号进行预处理,再利用双耳一致性函数从该声音源信号中提取有效的信号帧;
3)针对有效的信号帧基于时延补偿的方法,计算得到双耳时间差和双耳能量差;
4)将步骤3)中得到的双耳时间差按转向角在模板中搜索匹配的方向作为候选区域,其次在此候选区域中搜索匹配的双耳能量差所对应的俯仰角,利用贝叶斯分层的搜索策略获得候选区域里所有方向中概率最大的声音源的转向角和俯仰角,实现双耳声音源定位。
2.如权利要求1所述的基于时延补偿和双耳一致性的双耳声音源定位方法,其特征在于,步骤1)中,转向角采用非均匀的划分方法,俯仰角采用均匀划分的方式。
3.如权利要求1所述的基于时延补偿和双耳一致性的双耳声音源定位方法,其特征在于,步骤1)中,双耳时间差的方差是根据每个转向角上所有俯仰角的时间差统计得到;双耳能量差的均值和方差是针对每个方向进行多次训练测试,统计结果得到。
4.如权利要求1所述的基于时延补偿和双耳一致性的双耳声音源定位方法,其特征在于,步骤1)中采用冲激函数作为声音源与HRTF卷积或者直接利用录入的声音信号,计算出所有方向上的双耳时间差和双耳能量差,并统计相应的均值和方差。
5.如权利要求1所述的基于时延补偿和双耳一致性的双耳声音源定位方法,其特征在于,步骤2)中,所述预处理包括:预加重、分帧和加窗。
6.如权利要求1所述的基于时延补偿和双耳一致性的双耳声音源定位方法,其特征在于,在双耳信号均方误差最小的原则下进行时延补偿得到双耳能量差,利用双耳一致性函数对GCC-TDC函数修正得到双耳时间差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410142777.1/1.html,转载请声明来源钻瓜专利网。