[发明专利]波达方向估计方法、服务器以及计算机可读存储介质在审
申请号: | 201911355855.5 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111142066A | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 车云飞 | 申请(专利权)人: | 达闼科技成都有限公司 |
主分类号: | G01S3/802 | 分类号: | G01S3/802;G06N3/08 |
代理公司: | 北京智晨知识产权代理有限公司 11584 | 代理人: | 张婧 |
地址: | 610094 四川省成都市高*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 方向 估计 方法 服务器 以及 计算机 可读 存储 介质 | ||
本发明实施例涉及语音信号处理技术领域,公开了一种波达方向估计方法、服务器以及计算机可读存储介质。本发明中,波达方向估计方法包括:获取麦克风阵列采集第一声源的声音得到的多路音频、以及所述第一声源的声源角度;将所述多路音频作为输入,所述声源角度作为输出,训练神经网络模型;将待识别音频输入已训练的所述神经网络模型中,得到与所述待识别音频对应的待识别声源角度作为波达方向。本发明提供的波达方向估计方法、服务器以及计算机可读存储介质,能够在保证波达方向估计准确性的前提下,提高响应速度。
技术领域
本发明实施例涉及语音信号处理技术领域,特别涉及一种波达方向估计方法、服务器以及计算机可读存储介质。
背景技术
波达方向(DOA)的计算作为音频信号处理的重要环节,对波束成形和声源定位、声源跟踪有着极其重要的意义。传统的波达方向(DOA)估计方法是基于麦克风阵列各个麦克风直接的接收到音频信号的时间差异对声源角度进行统计学估计。
发明人发现现有技术中至少存在如下问题:基于麦克风阵列各个麦克风直接的接收到音频信号的时间差异对声源角度进行统计学估计的方法,虽然能够满足波达方向估计的准确性要求,但响应速度较慢。
发明内容
本发明实施方式的目的在于提供一种波达方向估计方法、服务器以及计算机可读存储介质,能够在保证波达方向估计准确性的前提下,提高响应速度。
为解决上述技术问题,本发明的实施方式提供了一种波达方向估计方法,包括:获取麦克风阵列采集第一声源的声音得到的多路音频、以及所述第一声源的声源角度;将所述多路音频作为输入,所述声源角度作为输出,训练神经网络模型;将待识别音频输入已训练的所述神经网络模型中,得到与所述待识别音频对应的待识别声源角度作为波达方向。
本发明的实施方式还提供了一种服务器,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述的波达方向估计方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的波达方向估计方法。
本发明实施方式相对于现有技术而言,通过获取麦克风阵列采集第一声源的声音得到的多路音频、以及所述第一声源的声源角度,将所述多路音频作为输入,所述声源角度作为输出,训练神经网络模型,将待识别音频输入已训练的所述神经网络模型中,得到与所述待识别音频对应的待识别声源角度作为波达方向,从而实现了端到端的波达方向的计算,在保证了波达方向估计准确性的前提下,提高了响应速度。
另外,所述获取麦克风阵列采集到的多路音频、以及与所述多路音频对应的声源角度,具体包括:获取所述麦克风阵列N次采集到的N个所述多路音频、以及分别与N个所述多路音频一一对应的N个声源角度;其中,每个所述多路音频对应的声源角度均不相等。
另外,获取的所述麦克风阵列相邻两次采集到的、两个所述多路音频对应的声源角度的差值相等。
另外,所述获取麦克风阵列采集到的多路音频、以及与所述多路音频对应的声源角度之后,还包括:识别所述多路音频中的语音段以及静音段;对所述语音段的所述多路音频进行标注;所述将所述多路音频作为输入,所述声源角度作为输出,训练神经网络模型,具体包括:将所述多路音频中被标注的部分作为输入,所述声源角度作为输出,训练所述神经网络模型。通过仅将所述语音段的所述多路音频作为输入来训练所述神经网络模型,避免了将静音段的所述多路音频也作为输入、而导致神经网络模型中的对应关系不准确的问题,从而提高了波达方向估计的准确性。
另外,所述对所述语音段的所述多路音频进行标注,具体为:以与所述多路音频对应的声源角度作为音频标注,对所述语音段的所述多路音频进行标注。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于达闼科技成都有限公司,未经达闼科技成都有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911355855.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水基原位定向防护涂料及其制备方法
- 下一篇:3D存储器件及其制造方法