[发明专利]语音信号处理方法、装置、系统、设备和存储介质在审

专利信息
申请号: 201811009263.3 申请日: 2018-08-31
公开(公告)号: CN110875060A 公开(公告)日: 2020-03-10
发明(设计)人: 田彪;何召卫;余涛 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G10L25/87 分类号: G10L25/87;G10L25/84;G10L21/0216;G10L15/25;G06K9/00
代理公司: 北京东方亿思知识产权代理有限责任公司 11258 代理人: 贺琳
地址: 开曼群岛*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 信号 处理 方法 装置 系统 设备 存储 介质
【说明书】:

发明公开了一种语音信号处理方法、装置、系统、设备和存储介质。该方法包括:使用图像采集设备获取实时图像,利用所述实时图像进行人脸识别,根据人脸识别结果检测目标人员发出语音的时间段;对麦克风阵列接收的音频信号进行声源定位,确定所述音频信号中声源的方位信息;根据所述实时图像中目标人员发出语音的时间段和所述声源的方位信息,进行语音起止点分析,确定所述音频信号中的语音起止时间点。根据本发明实施例提供的语音信号处理方法,可以在多干扰源的嘈杂环境下对语音信号进行语音端点检测,提高系统的抗干扰能力。

技术领域

本发明涉及数据处理技术领域,尤其涉及语音信号处理方法、装置、系统、设备和存储介质。

背景技术

在语音识别系统中,正确有效的进行语音端点检测(Voice Activity Detection,VAD)不仅可以减少计算量和缩短处理时间,而且能排除无声段的噪声干扰,提高语音识别的正确率。由于语音信号中不仅包含所需要的有用的语音端,同时也包含了无用的背景噪声段,语音端点检测可以从一段给定的语音信号中检测到语音的起始点和结束点,将语音信号分为语音端和无声段(背景噪声段)两类。

现有技术中,通常使用语音能量的检测器进行语音端点检测,但是这种语音段在检测方法在嘈杂的环境下经常失效,从而造成干扰语音也作为目标语音送往语音识别引擎,造成语音识别系统抗干扰能力差。

发明内容

本发明实施例提供一种语音信号处理方法、装置、系统、设备和存储介质,可以实现在多干扰源的嘈杂环境下,提高语音识别系统的抗干扰能力。

根据本发明实施例的一方面,提供一种语音信号处理方法,包括:

在图像采集设备的可视范围内进行人脸识别,根据人脸识别结果检测目标人员是否发出语音;

对接收的待识别声音信号进行声源定位,结合声源定位结果和目标人员是否发出语音的检测结果,确定目标区域中存在的语音信号;

对目标区域中存在的语音信号进行语音端点检测,得到语音信号中待识别的语音片段。

根据本发明实施例的另一方面,提供一种语音信号处理装置,包括:

在图像采集设备的可视范围内进行人脸识别,根据人脸识别结果检测目标人员是否发出语音;

对接收的待识别声音信号进行声源定位,结合声源定位结果和目标人员是否发出语音的检测结果,确定目标区域中存在的语音信号;

对目标区域中存在的语音信号进行语音端点检测,得到语音信号中待识别的语音片段。

根据本发明实施例的再一方面,提供一种语音信号处理设备,包括:存储器和处理器;该存储器用于存储程序;该处理器用于读取存储器中存储的可执行程序代码以执行上述的语音信号处理方法。

根据本发明实施例的又一方面,提供了一种语音信号处理系统,包括:

图像采集设备,用于获取实时图像;

集音设备,用于接收音频信号;

数据处理设备,用于利用实时图像进行人脸识别,根据人脸识别结果检测目标人员发出语音的时间段;对麦克风阵列接收的音频信号进行声源定位,确定音频信号中声源的方位信息;根据实时图像中目标人员发出语音的时间段和声源的方位信息,进行语音起止点分析,确定音频信号中的语音起止时间点。

根据本发明实施例的还一方面,提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行上述各方面的语音信号处理方法。

根据本发明实施例中的语音信号处理方法、装置、系统、设备和存储介质,可以在多干扰源的嘈杂环境下对语音信号进行语音端点检测,提高系统的抗干扰能力。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811009263.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top