[发明专利]声源定位方法、装置、计算机设备及存储介质在审
申请号: | 202210765842.0 | 申请日: | 2022-07-01 |
公开(公告)号: | CN115035900A | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 叶威志;杨亚星;叶威廷 | 申请(专利权)人: | 深圳魔耳智能声学科技有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L25/51;G10L25/24;G10K11/178;G06V10/74 |
代理公司: | 深圳众鼎汇成知识产权代理有限公司 44566 | 代理人: | 朱业刚 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声源 定位 方法 装置 计算机 设备 存储 介质 | ||
本发明公开了一种声源定位方法,获取音频采集信号,并对音频采集信号进行预处理,得到待定位音频信号;获取预设声纹识别模型,通过预设声纹识别模型对待定位音频信号进行声纹匹配,以确定待定位音频信号是否包括目标音频信号;当待定位音频信号包括目标音频信号时,获取至少一个目标采集图像;获取预设图像识别模型,通过预设图像识别模型对目标采集图像进行图像匹配,得到目标图像;一个目标图像关联一个声源音频信号;将声源音频信号和目标音频信号进行信号匹配,得到声源定位结果。如此,通过对音频采集信号进行预处理,实现了对待定位音频信号的获取。通过声纹匹配,实现了对目标音频信号的确定。通过图像匹配,实现了对目标图像的获取。
技术领域
本发明涉及信号处理技术领域,尤其涉及一种声源定位方法、装置、计算机设备及存储介质。
背景技术
语音交互被广泛应用于智能会议或者智能客服等场景中。在语音交互的应用过程中,往往需要在嘈杂环境下采集目标声源的语音信号。因此,对目标声源进行准确地声源定位是非常重要的。
现有技术中,往往是通过人工手动调整麦克风位置,使得麦克风可以朝向目标声源进行语音信号采集。但是目标声源是不断变化的,人工方式不能及时将麦克风调整至准确的位置。进而导致目标声源定位的准确率和效率较低,从而降低了语音信号采集的质量。
发明内容
本发明提供一种声源定位方法、装置、计算机设备及存储介质,本发明解决了现有技术中定位精度准确度低和效率低的问题。
一种声源定位方法,包括:
获取音频采集信号,并对所述音频采集信号进行预处理,得到待定位音频信号;
获取预设声纹识别模型,并将所述待定位音频信号输入至所述预设声纹识别模型,通过所述预设声纹识别模型对所述待定位音频信号进行声纹匹配,以确定所述待定位音频信号是否包括目标音频信号;
当所述待定位音频信号包括所述目标音频信号时,获取至少一个目标采集图像,所述目标采集图像通过图像采集设备在目标采集区域拍摄得到;所述目标采集区域根据所述目标音频信号的信号采集区域生成;
获取预设图像识别模型,将所述目标采集图像输入至所述预设图像识别模型,通过所述预设图像识别模型对所述目标采集图像进行图像匹配,得到目标图像;一个目标图像关联一个声源音频信号;
将所述声源音频信号和所述目标音频信号进行信号匹配,得到声源定位结果。
一种声源定位装置,包括:
获取模块,用于获取音频采集信号,并对所述音频采集信号进行预处理,得到待定位音频信号;
声纹匹配模块,用于获取预设声纹识别模型,并将所述待定位音频信号输入至所述预设声纹识别模型,通过所述预设声纹识别模型对所述待定位音频信号进行声纹匹配,以确定所述待定位音频信号是否包括目标音频信号;
采集模块,用于当所述待定位音频信号包括所述目标音频信号时,获取至少一个目标采集图像,所述目标采集图像通过图像采集设备在目标采集区域拍摄得到;所述目标采集区域根据所述目标音频信号的信号采集区域生成;
图像匹配模块,用于获取预设图像识别模型,将所述目标采集图像输入至所述预设图像识别模型,通过所述预设图像识别模型对所述目标采集图像进行图像匹配,得到目标图像;一个目标图像关联一个声源音频信号;
结果模块,用于将所述声源音频信号和所述目标音频信号进行信号匹配,得到声源定位结果。
一种计算机设备,包括存储器、处理器及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述所述声源定位方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述所述声源定位方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳魔耳智能声学科技有限公司,未经深圳魔耳智能声学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210765842.0/2.html,转载请声明来源钻瓜专利网。