[发明专利]语音信号处理方法、装置、系统、设备和存储介质在审
申请号: | 201811009263.3 | 申请日: | 2018-08-31 |
公开(公告)号: | CN110875060A | 公开(公告)日: | 2020-03-10 |
发明(设计)人: | 田彪;何召卫;余涛 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L25/84;G10L21/0216;G10L15/25;G06K9/00 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 贺琳 |
地址: | 开曼群岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信号 处理 方法 装置 系统 设备 存储 介质 | ||
1.一种语音信号处理方法,包括:
使用图像采集设备获取实时图像,利用所述实时图像进行人脸识别,根据人脸识别结果检测目标人员发出语音的时间段;
对麦克风阵列接收的音频信号进行声源定位,确定所述音频信号中声源的方位信息;
根据所述实时图像中目标人员发出语音的时间段和所述声源的方位信息,进行语音起止点分析,确定所述音频信号中的语音起止时间点。
2.根据权利要求1所述的语音信号处理方法,其中,所述利用所述实时图像进行人脸识别,包括:
检测所述实时图像中是否存在人脸图像;
所述实时图像中存在人脸图像时,对所述人脸图像进行人脸特征点识别,确定所述人脸图像中人嘴部边缘的特征点。
3.根据权利要求1所述的语音信号处理方法,其中,所述根据人脸识别结果检测目标人员发出语音的时间段,包括:
获取所述人脸识别结果中人嘴部边缘的特征点,根据所述人嘴部边缘的特征点的特征值变化信息,确定是否存在嘴部张合动作;
将存在所述嘴部张合动作的人员作为所述目标人员;以及
将所述目标人员的嘴部张合动作在所述实时图像中的持续时间段,作为所述目标人员发出语音的时间段。
4.根据权利要求1所述的语音信号处理方法,其中,所述对麦克风阵列接收的音频信号进行声源定位,确定所述音频信号中声源的方位信息,包括:
通过所述声源定位,得到所述音频信号中的声源的方位信息,所述方位信息包括所述声源相对于所述麦克风阵列的水平角、俯仰角和距离。
5.根据权利要求1所述的语音信号处理方法,其中,所述根据所述实时图像中目标人员发出语音的时间段和所述声源的方位信息,进行语音起止点分析,确定所述音频信号中的语音起止时间点,包括:
根据所述声源的方位信息,确定所述麦克风阵列的收音范围,获取所述收音范围内的音频信号;
对所述收音范围内的音频信号进行语音检测,确定所述收音范围内的音频信号的语音存在概率;
当所述收音范围内的音频信号的语音存在概率大于预设概率阈值时,根据所述实时图像中目标人员发出语音的时间段和所述声源的方位信息,进行语音起止点分析,确定所述音频信号中的语音起止时间点。
6.根据权利要求5所述的语音信号处理方法,其中,所述对所述收音范围内的音频信号进行语音检测,确定所述收音范围内的音频信号的语音存在概率,包括:
通过所述语音检测,提取所述音频信号的声学特征;
比较所述声学特征的特征值和语音信号声学特征的系统阈值,通过比较结果确定所述音频信号中是否存在语音信号;
根据所述音频信号中是否存在语音信号,确定所述语音存在概率。
7.根据权利要求5所述的语音信号处理方法,其中,所述对所述收音范围内的音频信号进行语音检测,确定所述收音范围内的音频信号的语音存在概率,包括:
利用语音活动检测组件,确定所述音频信号中存在语音信号的概率,其中,
所述语音活动检测组件是预先使用语音样本和非语音样本进行神经网络模型训练得到的。
8.根据权利要求1所述的语音信号处理方法,其中,所述根据所述实时图像中目标人员发出语音的时间段和所述声源的方位信息,进行语音起止点分析,确定所述音频信号中的语音起止时间点,包括:
根据所述声源的方位信息,确定所述麦克风阵列的收音范围;
获取所述收音范围内的音频信号,确定所述收音范围内的音频信号的语音起止时间点;
如果由所述语音起止时间点确定的语音时间段在所述目标人员发出语音的时间段内,将所述收音范围内的音频信号的语音起止时间点,作为所述音频信号中的语音起止时间点。
9.根据权利要求8所述的语音信号处理方法,其中,所述确定所述收音范围内的音频信号的起止时间点,包括:
对所述收音范围内的音频信号进行音频增强处理;
确定所述收音范围内的音频增强处理后的音频信号的语音起止点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811009263.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:模块式墙体
- 下一篇:燃油测量系统、油泵、油箱、方法和计算机存储介质