[发明专利]声源追踪方法、声源追踪设备及计算机可读存储介质在审
申请号: | 201711416776.1 | 申请日: | 2017-12-22 |
公开(公告)号: | CN108152788A | 公开(公告)日: | 2018-06-12 |
发明(设计)人: | 田拓;来意哲 | 申请(专利权)人: | 西安TCL软件开发有限公司 |
主分类号: | G01S3/802 | 分类号: | G01S3/802 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 710065 陕西省西安*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声源追踪 音频信号 计算机可读存储介质 声源方位 声源 工作效率 降低噪声 声音采集 声源检测 突发事件 突发语音 音频信息 应急反应 有效定位 语音识别 噪音声源 阈值检测 实时性 测向 解析 语音 终端 追踪 采集 | ||
本发明公开了一种声源追踪方法、声源追踪设备及计算机可读存储介质,该声源追踪方法包括:获取能量阈值和过零率阈值;根据能量阈值和过零率阈值检测并采集突发音频信号;对突发音频信号进行解析,以获取突发音频信号的声源方位信息;根据声源方位信息,确定终端的声音采集方向。本发明通过对突发音频信号进行阈值限定,以增加对突发语音端点的声源检测,从而能够对突发事件作出应急反应,避免噪音声源的干扰提高语音追踪和语音识别精确度和实时性,降低噪声影响,实现多声源测向,对声源的音频信息进行有效定位和提取,极大地提高了声源追踪设备的工作效率。
技术领域
本发明涉及声源追踪技术领域,尤其涉及一种声源追踪方法、声源追踪设备及计算机可读存储介质。
背景技术
目前,在酒店安防监控领域、大型报告会场、新闻现场等诸多空间场景中,通常需要麦克风阵列进行远场拾音,以追踪场景中发言人的语音。
但是现有的麦克风阵列存在以下缺陷,没有突发语音端点检测,不能对突发事件作为应急反应,并且容易受到其他声源的噪音干扰,从而影响远场拾音的效果,造成麦克风阵列在定位追踪语音上的精确度和实时性上有一定程度的降低,导致麦克风阵列无法正确地获取到发言人的语音信息,极大地降低了麦克风阵列的工作效率。
发明内容
本发明的主要目的在于提供一种声源追踪方法、声源追踪设备及计算机可读存储介质,旨在解决麦克风阵列在远场拾音上的精确度和实时性的追踪定位效率低下的技术问题。
为实现上述目的,本发明实施例提供一种声源追踪方法,所述声源追踪方法应用于声源追踪终端,所述声源追踪方法包括:
获取能量阈值和过零率阈值;
根据能量阈值和过零率阈值检测并采集突发音频信号;
对突发音频信号进行解析,以获取突发音频信号的声源方位信息;
根据声源方位信息,确定终端的声音采集方向。
优选地,所述根据能量阈值和过零率阈值检测并采集突发音频信号的步骤包括:
获取现场音频信号并解析,以获取现场音频信号的能量值和过零率;
将所有现场音频信号中能量值大于能量阈值,且过零率大于过零率阈值的现场音频信号设为突发音频信号。
优选地,所述对突发音频信号进行解析,以获取突发音频信号的声源方位信息的步骤包括:
获取所有突发音频信号中能量值最大的最大音频信号,并根据能量值确定最大音频信号的时延值;
根据信号时延值获取突发音频信号中所有的时频点;
将所有时频点进行聚类处理,以获得声源方位信息。
优选地,所述将所有时频点进行聚类处理的步骤包括:
对所有时频点进行降噪处理,以获取到降噪时频点;
将所有降噪时频点进行聚类处理,以获得声源方位信息。
优选地,所述根据声源方位信息,确定终端的声音采集方向的步骤包括:
当检测到多个声源方位信息时,获取各声源方位信息的波束能量;
将波束能量最大的声源方位信息的方向确定为终端的声音采集方向。
优选地,所述获取能量阈值和过零率阈值的步骤包括:
根据预设测试条件采集预设采集范围内的样本音频信号;
根据样本音频信号进行计算,以获取能量阈值和过零率阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安TCL软件开发有限公司,未经西安TCL软件开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711416776.1/2.html,转载请声明来源钻瓜专利网。