[发明专利]一种声源定位方法及装置在审

专利信息
申请号: 201611154066.1 申请日: 2016-12-14
公开(公告)号: CN108231085A 公开(公告)日: 2018-06-29
发明(设计)人: 何赛娟;陈扬坤;陈展 申请(专利权)人: 杭州海康威视数字技术股份有限公司
主分类号: G10L21/0216 分类号: G10L21/0216;G10L21/0224;G10L25/27;G01S5/20
代理公司: 北京柏杉松知识产权代理事务所(普通合伙) 11413 代理人: 项京;马敬
地址: 310051 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 目标音频信号 目标方位角 麦克风 时延 向量 目标机器 声源定位 方位角 音频帧 采集 分帧 声源 样本 机器学习模型 音频信号样本 麦克风阵列 计算目标 目标音频 时延计算 输出内容 输入内容 应用场景 学习
【说明书】:

发明实施例公开了一种声源定位方法及装置,所述方法包括:获得麦克风阵列中各个麦克风采集的目标音频信号;对各个麦克风采集的目标音频信号进行分帧处理,并根据分帧结果,确定各个麦克风所对应的目标音频帧;计算目标音频帧所对应的目标时延向量;将目标时延向量输入至预先训练完成的目标机器学习模型,得到目标方位角标识值;基于目标方位角标识值,得到目标音频信号的声源所对应的目标方位角。由于目标机器学习模型是以实际应用场景中所采集到的音频帧样本对应的时延向量样本作为输入内容,且以音频信号样本对应的方位角标识值作为输出内容所训练得到的机器学习模型,所以即使在时延计算不够精确的情况下,也能够准确确定声源的方位角。

技术领域

本发明涉及音频信号处理领域,特别是涉及一种声源定位方法及装置。

背景技术

现如今声源定位的应用越来越广泛,例如在视频会议系统、智能家电、机器人等产品中都有重要应用。目前最常用的声源定位方法是基于麦克风阵列的声源定位方法,在该方法中,通过由若干个麦克风组成的麦克风阵列接收音频信号,然后通过信号处理方法对音频信号进行处理,进而确定声源方向对应的方位角,完成声源定位。其中,最常用的麦克风阵列为线阵,如图1所示,即为由多个麦克风沿直线排列形成的直线型麦克风阵列。

在现有的基于麦克风阵列的声源定位方法中,通过麦克风阵列接收到音频信号后,采用时延估计方法来定位声源。具体地,通过麦克风阵列接收音频信号,并计算每个麦克风接收的音频信号相对于参考点接收的音频信号的时延,然后根据时延与方位角的固定的映射关系,预估声源的方位角,进而完成对声源的定位。

在实际应用中,由于噪声等环境因素的影响,时延的计算往往不准确,导致采用固定的映射关系进行声源定位的精确度低,特别是在线阵端射位置(即图1中所示θ为0度和180度附近位置),甚至会出现声源定位失败的问题。

发明内容

本发明实施例公开了一种声源定位方法及装置,用以对声源进行精准定位。技术方案如下:

第一方面,本发明实施例提供了一种声源定位方法,所述方法包括:

获得麦克风阵列中各个麦克风采集的目标音频信号;

对所述各个麦克风采集的目标音频信号进行分帧处理,并根据分帧结果,确定所述各个麦克风所对应的目标音频帧;

计算所述目标音频帧所对应的目标时延向量,其中,所述目标时延向量为:基于各个麦克风接收相应目标音频帧的时间差所形成的向量;

将所述目标时延向量输入至预先训练完成的目标机器学习模型,得到目标方位角标识值,其中,所述目标机器学习模型为:以音频帧样本对应的时延向量样本作为输入内容,且以音频信号样本对应的方位角标识值作为输出内容所训练得到的机器学习模型,所述音频帧样本为对所述音频信号样本进行分帧处理得到的音频帧;

基于所述目标方位角标识值,得到所述目标音频信号的声源所对应的目标方位角。

可选的,所述计算所述目标音频帧所对应的目标时延向量的步骤,包括:

对所述目标音频帧进行两两互相关处理,得到所述目标时延向量。

可选的,所述计算所述目标音频帧所对应的目标时延向量的步骤,包括:

对所述目标音频帧进行上采样处理,并将上采样处理后的音频帧转换为频域信号帧;

对所述频域信号帧进行两两互相关处理,得到所述目标时延向量。

可选的,所述目标机器学习模型的训练方式包括:

构建初始机器学习模型;

确定用于模型训练的多个预设方位角的方位角标识值;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611154066.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top