[发明专利]一种基于加权模板匹配的双耳声源定位方法和装置在审
申请号: | 202011456914.0 | 申请日: | 2020-12-10 |
公开(公告)号: | CN112731289A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 丁润伟;孙永恒;杨冰;刘宏 | 申请(专利权)人: | 深港产学研基地(北京大学香港科技大学深圳研修院);北京大学深圳研究生院 |
主分类号: | G01S5/18 | 分类号: | G01S5/18 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 518057 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 加权 模板 匹配 声源 定位 方法 装置 | ||
本发明公开了一种基于加权模板匹配的双耳声源定位方法和装置。在训练阶段,首先从训练数据中提取不同方向的双耳互相关函数和双耳强度差,为提取的各个方向的双耳互相关函数和双耳强度差建立模板;然后通过梯度下降法训练不同方向、不同频带的权重值。在线定位阶段,同样首先对信号提取特征,接着在不同特征和不同频带上将所提取的特征与各个方向的模板进行相似度匹配,最后通过加权融合不同特征不同频带的相似度,得到最终的声源方向相似度,取最大相似度方向为声源方向。实验在不同种类噪声环境下进行,实验结果表明本发明可以在一定程度上抵抗噪声的干扰,实现声源的角度定位问题。
技术领域
本发明属于信息技术领域,涉及一种应用在语音感知和语音增强中的双耳声源定位方法,具体涉及一种基于加权模板匹配的双耳声源定位方法和装置。
技术背景
人机交互在机器人领域具有越来越重要的作用,人机交互能够使人与机器的交流更加方便、高效、友好。在日常生活中,人们感知外界信息的主要方式有视觉、听觉、触觉、嗅觉、味觉等。其中人类通过视觉获得的信息约占70%-80%,通过听觉获得的信息约占10%-20%。听觉感知是人们与外界进行信息交流最自然、方便,有效的方式之一。另外相比于视觉信号,听觉信号具有360度的视野,不受光照影响,也不需要满足声源和麦克风之间无遮挡物等条件,因此,机器人听觉是实现人机交互的重要途径之一。机器人听觉主要包括声源的定位与追踪、语音去噪、语音增强、语音分离、说话人识别、语音识别、语音情感识别等,其中声源定位作为机器人听觉前端的一个任务,可以为其它语音任务提供语音空间位置信息作为辅助。机器人声源定位已成为机器人听觉系统的一个重要组成部分。
语音分离来自于著名的‘鸡尾酒会’问题,即人们可以在众多谈话声和噪声中聚焦于某个人的声音的能力,该问题长久以来被认为是语音分离中的一个具有挑战性的问题。通过在语音分离中结合声源定位技术获得声源的方位信息,有助于分离混叠的语音,能够提高对感兴趣方向语音的识别的准确率。在视频会议中,可以根据麦克风声源定位的结果及时调整摄像机的位置,使其转向说话人的位置。在视频监控中,可以根据声源方向信息调整摄像机的角度,扩大监控范围,达到更好的监控作用。
根据麦克风数量以及是否具有机器人工头的耳蜗结构,声源定位技术大体可以分为基于麦克风阵列的声源定位和基于双耳麦克风阵列的声源定位。双耳麦克风定位技术在人形机器人领域具有重要的作用,它能够充分利用耳蜗结构对声音的衍射作用,模拟人类听觉特性。机器人双耳声源定位仅使用两个麦克风,分别搭载在机器人头部左右侧。相比两麦克风阵列的声源定位,双耳声源定位因为有了耳蜗及人工头对声音信号的衍射等作用,可以更好的模拟人类的听觉特性,可以更好的应用在人形机器人,助听器语音增强、虚拟现实等场景。并且可以消除两麦克风声源定位前后向的歧义问题。
双耳声源定位主要包括以下几个步骤:
1、双耳信号的模拟与录制。采用双耳冲激函数与纯净声音信号卷积获取模拟双耳声音信号,或者直接录制双耳信号作为真实信号。
2、信号的数模转换,预滤波。首先将模拟信号进行预滤波,高通滤波器滤除50Hz的电源噪声信号,低通滤波滤除声音信号中频率分量超过采样频率一半的部分,防止混叠干扰,对模拟声音信号进行采样和量化得到数字信号。
3、预加重。信号通过高频加重滤波器冲激响应H(z)=1-0.95z-1,以补偿嘴唇辐射带来的高频衰减。
4、分帧、加窗。语音信号具有时变的特性,但是人体嘴部肌肉运动相对较慢,一般认为语音信号在短时间内是平稳的,一般为10ms-30ms。因此往往按照上述时间间隔对信号进行分帧处理,例如每20ms分一帧。另外,为了防止分帧带来的问题,一般对分帧后的信号进行加窗处理,常见的窗包括矩形窗、汉宁窗、汉明窗等,其中,汉明窗使用较为广泛。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深港产学研基地(北京大学香港科技大学深圳研修院);北京大学深圳研究生院,未经深港产学研基地(北京大学香港科技大学深圳研修院);北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011456914.0/2.html,转载请声明来源钻瓜专利网。