[发明专利]语音信号处理方法、装置、系统、设备和存储介质在审
申请号: | 201811009263.3 | 申请日: | 2018-08-31 |
公开(公告)号: | CN110875060A | 公开(公告)日: | 2020-03-10 |
发明(设计)人: | 田彪;何召卫;余涛 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L25/84;G10L21/0216;G10L15/25;G06K9/00 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 贺琳 |
地址: | 开曼群岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信号 处理 方法 装置 系统 设备 存储 介质 | ||
本发明公开了一种语音信号处理方法、装置、系统、设备和存储介质。该方法包括:使用图像采集设备获取实时图像,利用所述实时图像进行人脸识别,根据人脸识别结果检测目标人员发出语音的时间段;对麦克风阵列接收的音频信号进行声源定位,确定所述音频信号中声源的方位信息;根据所述实时图像中目标人员发出语音的时间段和所述声源的方位信息,进行语音起止点分析,确定所述音频信号中的语音起止时间点。根据本发明实施例提供的语音信号处理方法,可以在多干扰源的嘈杂环境下对语音信号进行语音端点检测,提高系统的抗干扰能力。
技术领域
本发明涉及数据处理技术领域,尤其涉及语音信号处理方法、装置、系统、设备和存储介质。
背景技术
在语音识别系统中,正确有效的进行语音端点检测(Voice Activity Detection,VAD)不仅可以减少计算量和缩短处理时间,而且能排除无声段的噪声干扰,提高语音识别的正确率。由于语音信号中不仅包含所需要的有用的语音端,同时也包含了无用的背景噪声段,语音端点检测可以从一段给定的语音信号中检测到语音的起始点和结束点,将语音信号分为语音端和无声段(背景噪声段)两类。
现有技术中,通常使用语音能量的检测器进行语音端点检测,但是这种语音段在检测方法在嘈杂的环境下经常失效,从而造成干扰语音也作为目标语音送往语音识别引擎,造成语音识别系统抗干扰能力差。
发明内容
本发明实施例提供一种语音信号处理方法、装置、系统、设备和存储介质,可以实现在多干扰源的嘈杂环境下,提高语音识别系统的抗干扰能力。
根据本发明实施例的一方面,提供一种语音信号处理方法,包括:
在图像采集设备的可视范围内进行人脸识别,根据人脸识别结果检测目标人员是否发出语音;
对接收的待识别声音信号进行声源定位,结合声源定位结果和目标人员是否发出语音的检测结果,确定目标区域中存在的语音信号;
对目标区域中存在的语音信号进行语音端点检测,得到语音信号中待识别的语音片段。
根据本发明实施例的另一方面,提供一种语音信号处理装置,包括:
在图像采集设备的可视范围内进行人脸识别,根据人脸识别结果检测目标人员是否发出语音;
对接收的待识别声音信号进行声源定位,结合声源定位结果和目标人员是否发出语音的检测结果,确定目标区域中存在的语音信号;
对目标区域中存在的语音信号进行语音端点检测,得到语音信号中待识别的语音片段。
根据本发明实施例的再一方面,提供一种语音信号处理设备,包括:存储器和处理器;该存储器用于存储程序;该处理器用于读取存储器中存储的可执行程序代码以执行上述的语音信号处理方法。
根据本发明实施例的又一方面,提供了一种语音信号处理系统,包括:
图像采集设备,用于获取实时图像;
集音设备,用于接收音频信号;
数据处理设备,用于利用实时图像进行人脸识别,根据人脸识别结果检测目标人员发出语音的时间段;对麦克风阵列接收的音频信号进行声源定位,确定音频信号中声源的方位信息;根据实时图像中目标人员发出语音的时间段和声源的方位信息,进行语音起止点分析,确定音频信号中的语音起止时间点。
根据本发明实施例的还一方面,提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行上述各方面的语音信号处理方法。
根据本发明实施例中的语音信号处理方法、装置、系统、设备和存储介质,可以在多干扰源的嘈杂环境下对语音信号进行语音端点检测,提高系统的抗干扰能力。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811009263.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:模块式墙体
- 下一篇:燃油测量系统、油泵、油箱、方法和计算机存储介质