[发明专利]语音检测的方法和装置有效
申请号: | 202010697058.1 | 申请日: | 2020-07-20 |
公开(公告)号: | CN111863036B | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 李鑫;黄斌;张策;白锦峰;贾磊 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L25/30 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 检测 方法 装置 | ||
本申请公开了语音检测的方法和装置,涉及语音处理和深度学习技术领域。具体实施方式包括:获取目标语音;将该目标语音输入预先训练的深度神经网络,得到该目标语音在预设的多个方向区间中的每个方向区间是否存在子语音,其中,该深度神经网络用于预测语音在该多个方向区间中的每个方向区间是否存在子语音。本申请可以对每个方向区间分别进行预测,从而准确地确定出目标语音在每个方向区间是否存在子语音,实现精准预测。
技术领域
本申请涉及计算机技术领域,具体涉及语音处理和深度学习技术领域,尤其涉及语音检测的方法和装置。
背景技术
到达方向(Direction Of Arrival,DOA)估计,为对波所到达的方向进行估计,也即对声源方向进行估计。这里的来源可以是音频来源或者其它可用于通信的信号来源。话音激活检测(Voice Activity Detection,VAD),可以检测当前音频中是否包含语音信号(即人声信号),也即对音频进行判断,将人声信号从各种背景噪声区分出来。
相关技术中的到达方向估计,通常利用接收装置列阵获取信号,并确定一个从接收装置到信号的波达方向线,并利用波达方向线进行三角测量,从而确定到达方向。
发明内容
提供了一种语音检测的方法、装置、电子设备以及存储介质。
根据第一方面,提供了一种语音检测的方法,包括:获取目标语音;将目标语音输入预先训练的深度神经网络,得到目标语音在预设的多个方向区间中的每个方向区间是否存在子语音,其中,深度神经网络用于预测语音在多个方向区间中的每个方向区间是否存在子语音。
根据第二方面,提供了一种深度神经网络的训练方法,包括:获取训练样本,其中,所述训练样本中的语音样本包括在预设的至少一个方向区间的子语音;将所述语音样本输入所述深度神经网络,得到预测结果,其中,所述深度神经网络用于预测语音在多个方向区间中的每个方向区间是否存在子语音;基于所述预测结果,对所述深度神经网络进行训练,得到训练后的深度神经网络。
根据第三方面,提供了一种语音检测的装置,包括:获取单元,被配置成获取目标语音;预测单元,被配置成将所述目标语音输入预先训练的深度神经网络,得到所述目标语音在预设的多个方向区间中的每个方向区间是否存在子语音,其中,所述深度神经网络用于预测语音在所述多个方向区间中的每个方向区间是否存在子语音。
根据第四方面,提供了一种深度神经网络的训练装置,包括:样本获取单元,被配置成获取训练样本,其中,所述训练样本中的语音样本包括在预设的至少一个方向区间的子语音;输入单元,被配置成将所述语音样本输入所述深度神经网络,得到预测结果,其中,所述深度神经网络用于预测语音在多个方向区间中的每个方向区间是否存在子语音;训练单元,被配置成基于所述预测结果,对所述深度神经网络进行训练,得到训练后的深度神经网络。
根据第五方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如语音检测的方法或深度神经网络的训练方法中任一实施例的方法。
根据第六方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如语音检测的方法或深度神经网络的训练方法中任一实施例的方法。
根据本申请的方案,可以对每个方向区间分别进行预测,从而准确地确定出目标语音在每个方向区间是否存在子语音,实现精准预测。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请一些实施例可以应用于其中的示例性系统架构图;
图2是根据本申请的语音检测的方法的一个实施例的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010697058.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种硅酸钙镁装饰板的加工装置
- 下一篇:语音识别方法和装置