[发明专利]声音处理方法、装置和电子设备在审
申请号: | 201711258117.X | 申请日: | 2017-12-04 |
公开(公告)号: | CN107993671A | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 朱长宝;陈本东;李育国 | 申请(专利权)人: | 南京地平线机器人技术有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;H04N5/232 |
代理公司: | 北京市正见永申律师事务所11497 | 代理人: | 黄小临,王怀章 |
地址: | 210046 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 处理 方法 装置 电子设备 | ||
技术领域
本申请涉及声音处理领域,且更为具体地,涉及一种声音处理方法、声音处理装置、电子设备和计算机可读存储介质。
背景技术
随着各种电子设备的普及,为了提高控制电子设备的便利性,越来越多的电子设备提供了通过语音进行控制的功能。例如,诸如智能手机或者车载设备的电子设备提供有语音控制功能,用户可以通过语音来控制电子设备以执行相应的功能。因此,电子设备需要识别用户的语音,从而获知用户的真实意图,以控制相应的功能单元执行用户所需的功能。但是,无论是在使用智能手机的家庭环境,还是在使用车载设备的车载环境下,语音识别都比较容易受到外界环境的干扰,特别是外界噪声对于语音识别影响较大。
因此,现有的声音处理方法存在音质较差、识别率较低的问题。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种声音处理方法、声音处理装置、电子设备和计算机可读存储介质,其可以提高声音的音质从而改进声音的识别率。
根据本申请的一个方面,提供了一种声音处理方法,包括:根据麦克风阵列所采集的多个声音信号和摄像头所采集的图像信号确定声音预处理方向;基于所述声音预处理方向选择预处理滤波系数;使用所述预处理滤波系数对所述多个声音信号进行预处理滤波,以得到初始信号源信号和初始噪声源信号;确定自适应滤波系数;以及,使用所述自适应滤波系数来对所述初始信号源信号和所述初始噪声源信号进行自适应滤波,以得到增强信号源信号。
根据本申请的另一方面,提供了一种声音处理装置,包括:声音预处理方向确定单元,用于根据麦克风阵列所采集的多个声音信号和摄像头所采集的图像信号确定声音预处理方向;预处理滤波系数选择单元,用于基于所述声音预处理方向选择预处理滤波系数;预处理滤波单元,用于使用所述预处理滤波系数对所述多个声音信号进行预处理滤波,以得到初始信号源信号和初始噪声源信号;自适应滤波系数确定单元,用于确定自适应滤波系数;以及,自适应滤波单元,用于使用所述自适应滤波系数来对所述初始信号源信号和所述初始噪声源信号进行自适应滤波,以得到增强信号源信号。
根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的声音处理方法。
根据本申请的又一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的声音处理方法。
与现有技术相比,采用根据本申请实施例的声音处理方法、声音处理装置、电子设备和计算机可读存储介质,可以根据麦克风阵列所采集的多个声音信号和摄像头所采集的图像信号确定声音预处理方向;基于所述声音预处理方向选择预处理滤波系数;使用所述预处理滤波系数对所述多个声音信号进行预处理滤波,以得到初始信号源信号和初始噪声源信号;确定自适应滤波系数;以及,使用所述自适应滤波系数来对所述初始信号源信号和所述初始噪声源信号进行自适应滤波,以得到增强信号源信号。因此,可以通过基于声音预处理方向来增强信号源信号,从而提高声音的音质,进而改进声音识别的精度。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1图示了根据本申请实施例的声音处理方法的应用场景的示意图;
图2图示了根据本申请实施例的声音处理方法的流程图;
图3图示了根据本申请实施例的声音处理方法中确定声音预处理方向的流程图;
图4图示了根据本申请实施例的声音处理方法中的确定声音增强方向和声音抑制方向中的至少一个的流程图;
图5图示了根据本申请实施例的声音处理方法中的自适应滤波系数更新的流程图;
图6图示了根据本申请实施例的声音处理方法中的用户的嘴动检测的流程图;
图7图示了根据本申请实施例的声音处理装置的框图;
图8图示了根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京地平线机器人技术有限公司,未经南京地平线机器人技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711258117.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于统计模型的麦克风阵列语音增强方法
- 下一篇:频带扩展方法及装置