[发明专利]一种声源分析方法及系统在审

申请号：	202011333240.5	申请日：	2020-11-24
公开（公告）号：	CN112562730A	公开（公告）日：	2021-03-26
发明（设计）人：	程佳;李骊	申请（专利权）人：	北京华捷艾米科技有限公司
主分类号：	G10L25/51	分类号：	G10L25/51;G10L21/0216;G10L21/0264;G06K9/00;G01S5/20
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	钱娜
地址：	100193 北京市海淀区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种声源分析方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种声源分析方法及系统，方法包括：获取高信噪比音频角度，获取低信噪比音频角度；基于高信噪比音频角度进行投票统计，得到第一说话人位置；基于低信噪比音频角度和第一说话人位置进行投票统计，得到噪声位置。本发明能够有效的分析出声源中的说话人位置和噪声位置。

技术领域

本发明涉及数据分析技术领域，尤其涉及一种声源分析方法及系统。

背景技术

传统的SRP(Steered Responser Power，可控响应功率)算法声源定位技术，对回声消除后的信号在空间各个方向做固定波束形成，波束输出功率最大的方向即为当前帧的声源方向，但是无法对声源类型做出判别。

因此，如何有效的对声源进行分析，以判别出声源的不同类型，是一项亟待解决的问题。

发明内容

有鉴于此，本发明提供了一种声源分析方法，能够有效的判别出声源的不同类型。

本发明提供了一种声源分析方法，包括：

获取高信噪比音频角度；

获取低信噪比音频角度；

基于所述高信噪比音频角度进行投票统计，得到第一说话人位置；

基于所述低信噪比音频角度和所述第一说话人位置进行投票统计，得到噪声位置。

优选地，所述方法还包括：

获取视频角度；

基于所述高信噪比音频角度和所述视频角度进行投票统计，得到第二说话人位置；

基于所述低信噪比音频角度和所述第二说话人位置进行投票统计，得到噪声位置。

优选地，所述获取高信噪比音频角度，包括：

获取原始角度；

当信噪比大于预设值时，基于信噪比高低对所述原始角度进行筛选，得到高信噪比音频角度。

优选地，所述获取低信噪比音频角度，包括：

获取原始角度；

基于信噪比高低对所述原始角度进行筛选，得到高信噪比音频角度。

优选地，所述获取视频角度包括：

基于人脸识别得到人脸坐标或基于骨架识别得到头部坐标；

将所述人脸坐标或头部坐标转化到与麦克风阵列统一的坐标系中，得到视频角度。

一种声源分析系统，包括：

第一获取模块，用于获取高信噪比音频角度；

第二获取模块，用于获取低信噪比音频角度；

第一分析模块，用于基于所述高信噪比音频角度进行投票统计，得到第一说话人位置；

第二分析模块，用于基于所述低信噪比音频角度和所述第一说话人位置进行投票统计，得到噪声位置。

优选地，所述系统还包括：

第三获取模块，用于获取视频角度；

第三分析模块，用于基于所述高信噪比音频角度和所述视频角度进行投票统计，得到第二说话人位置；

第四分析模块，用于基于所述低信噪比音频角度和所述第二说话人位置进行投票统计，得到噪声位置。

优选地，所述第一获取模块具体用于：

获取原始角度；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京华捷艾米科技有限公司，未经北京华捷艾米科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011333240.5/2.html，转载请声明来源钻瓜专利网。

上一篇：一种富含慢消化和抗性淀粉的食品原料及其制备方法与应用
下一篇：一种信息回溯方法、装置、存储介质及电子设备

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种声源分析方法及系统在审

专利文献下载