[发明专利]一种声源定位方法及装置在审

申请号：	201611154066.1	申请日：	2016-12-14
公开（公告）号：	CN108231085A	公开（公告）日：	2018-06-29
发明（设计）人：	何赛娟;陈扬坤;陈展	申请（专利权）人：	杭州海康威视数字技术股份有限公司
主分类号：	G10L21/0216	分类号：	G10L21/0216;G10L21/0224;G10L25/27;G01S5/20
代理公司：	北京柏杉松知识产权代理事务所(普通合伙) 11413	代理人：	项京;马敬
地址：	310051 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明实施例公开了一种声源定位方法及装置，所述方法包括：获得麦克风阵列中各个麦克风采集的目标音频信号；对各个麦克风采集的目标音频信号进行分帧处理，并根据分帧结果，确定各个麦克风所对应的目标音频帧；计算目标音频帧所对应的目标时延向量；将目标时延向量输入至预先训练完成的目标机器学习模型，得到目标方位角标识值；基于目标方位角标识值，得到目标音频信号的声源所对应的目标方位角。由于目标机器学习模型是以实际应用场景中所采集到的音频帧样本对应的时延向量样本作为输入内容，且以音频信号样本对应的方位角标识值作为输出内容所训练得到的机器学习模型，所以即使在时延计算不够精确的情况下，也能够准确确定声源的方位角。
搜索关键词：	目标音频信号目标方位角麦克风时延向量目标机器声源定位方位角音频帧采集分帧声源样本机器学习模型音频信号样本麦克风阵列计算目标目标音频时延计算输出内容输入内容应用场景学习
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种声源定位方法，其特征在于，所述方法包括：获得麦克风阵列中各个麦克风采集的目标音频信号；对所述各个麦克风采集的目标音频信号进行分帧处理，并根据分帧结果，确定所述各个麦克风所对应的目标音频帧；计算所述目标音频帧所对应的目标时延向量，其中，所述目标时延向量为：基于各个麦克风接收相应目标音频帧的时间差所形成的向量；将所述目标时延向量输入至预先训练完成的目标机器学习模型，得到目标方位角标识值，其中，所述目标机器学习模型为：以音频帧样本对应的时延向量样本作为输入内容，且以音频信号样本对应的方位角标识值作为输出内容所训练得到的机器学习模型，所述音频帧样本为对所述音频信号样本进行分帧处理得到的音频帧；基于所述目标方位角标识值，得到所述目标音频信号的声源所对应的目标方位角。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司，未经杭州海康威视数字技术股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201611154066.1/，转载请声明来源钻瓜专利网。

上一篇：一种基于Teager能量算子的改进小波阈值函数去噪方法
下一篇：一种基于FPGA的深度学习语音增强器及方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种声源定位方法及装置在审

专利文献下载