[发明专利]自移动设备的音频数据处理方法、设备及存储介质在审
申请号: | 202211249634.1 | 申请日: | 2022-10-12 |
公开(公告)号: | CN115631750A | 公开(公告)日: | 2023-01-20 |
发明(设计)人: | 陈明佳 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L21/0208;G10L25/30;G10L25/87;G01S5/18 |
代理公司: | 苏州谨和知识产权代理事务所(特殊普通合伙) 32295 | 代理人: | 许冬莹 |
地址: | 215000 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 移动 设备 音频 数据处理 方法 存储 介质 | ||
本申请属于语音交互技术领域,具体涉及一种自移动设备的音频数据处理方法、设备及存储介质。该方法包括:获取音频采集组件采集的第一音频数据;基于第一音频数据确定第一降噪模型本次降噪使用的模型分支和第二降噪模型本次降噪使用的模型参数;将第一音频数据输入第一降噪模型,以过滤第一音频数据中的机械噪声,得到第一过滤数据;将第一过滤数据输入第二降噪模型,以过滤第一过滤数据中自移动设备外部产生的噪声,得到第二过滤数据;可以解决传统的音频处理方法会导致对音频降噪效果较差的问题;通过将至少两组音频采集组件采集的音频数据依次输入第一降噪模型和第二降噪模型,进行两次降噪处理,因此可以提高音频降噪效果。
【技术领域】
本申请属于语音交互技术领域,具体涉及一种自移动设备的音频数据处理方法、设备及存储介质。
【背景技术】
目前,自移动设备例如扫地机、移动机器人都具备与用户进行语音交互的能力,在语音交互的过程中需要对音频数据进行处理。
传统的音频数据处理方法包括:获取音频数据;基于波束成形算法对音频数据进行降噪处理。
然而,由于自移动设备在移动的过程中会产生很多不可控的噪声,传统的音频处理方法会导致对音频降噪效果较差的问题。
【发明内容】
本申请提供了自移动设备的音频数据处理方法、设备及存储介质,可以解决由于自移动设备在移动的过程中会产生很多不可控的噪声,传统的音频处理方法会导致对音频降噪效果较差的问题。本申请提供如下技术方案:
第一方面,提供了一种自移动设备的音频数据处理方法,所述方法包括:获取所述至少两组音频采集组件采集的第一音频数据;
基于所述第一音频数据确定所述自移动设备所处的噪声环境;
基于所述噪声环境确定第一降噪模型本次降噪使用的模型分支和第二降噪模型本次降噪使用的模型参数;所述第一降噪模型包括至少两个模型分支,所述第一降噪模型使用训练数据对预设的神经网络模型训练得到,所述训练数据包括样本数据和标注数据,所述样本数据包括目标音频与机械噪声融合的样本音频数据,所述标注数据为所述目标音频;所述第二模型基于波束成形算法构建,所述波束成形算法包括至少一个模型参数;
将所述第一音频数据输入所述第一降噪模型,以过滤所述第一音频数据中的机械噪声,得到第一过滤数据;
将所述第一过滤数据输入所述第二降噪模型,以过滤所述第一过滤数据中所述自移动设备外部产生的噪声,得到第二过滤数据。
可选地,所述将所述第一过滤数据输入所述第二降噪模型,以过滤所述第一过滤数据中所述自移动设备外部产生的噪声,得到第二过滤数据之后,还包括:
确定所述第二过滤数据是否为唤醒音频;
在所述第二过滤数据是唤醒音频的情况下,使用所述第二过滤数据确定所述第一音频数据对应的第一声源位置,以基于与所述第一声源位置相适配的波达方向采集音频数据。
可选地,所述方法还包括:
获取所述自移动设备的当前运动状态;
在所述第二过滤数据是唤醒音频、且所述当前运动状态为静置状态的情况下,触发所述使用所述唤醒音频确定所述第一音频数据对应的声源位置的步骤。
可选地,所述方法还包括:
在所述第二过滤数据是唤醒音频,且所述当前运动状态为移动状态的情况下,获取第二音频数据;
使用所述第一降噪模型和所述第二降噪模型依次对所述第二音频数据进行过滤,得到第三过滤数据;
使用所述第三过滤数据确定所述第二音频数据对应的第二声源位置,以基于与所述第二声源位置相适配的波达方向采集音频数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211249634.1/2.html,转载请声明来源钻瓜专利网。