[发明专利]语音识别的方法、设备和存储介质有效
申请号: | 202210372646.7 | 申请日: | 2022-04-11 |
公开(公告)号: | CN114464184B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 王志超 | 申请(专利权)人: | 北京荣耀终端有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/06;G10L15/20;G10L21/0208;G01S5/20;G01S11/14;G01S11/12 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 戴皓 |
地址: | 100095 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 设备 存储 介质 | ||
1.一种语音识别的方法,其特征在于,应用于智能终端,所述方法包括:
检测唤醒信号;
检测到所述唤醒信号后,测量声源的距离信息,所述声源的距离信息表示所述声源到所述智能终端的距离;
根据所述声源的距离信息优化语音增强算法,并用优化后的所述语音增强算法处理用户语音,得到增强用户语音,所述用户语音为所述智能终端从所述声源采集到的语音信号;
根据所述声源的距离信息优化语音识别算法,并用优化后的语音识别算法识别所述增强用户语音,得到所述用户语音的识别结果;
所述语音增强算法至少包括权重预测估计算法;
所述根据所述声源的距离信息优化语音增强算法,至少包括:
根据所述声源的距离信息确定优化系数;
根据所述优化系数调整所述权重预测估计算法预测的混响信号在观测信号中的比例;所述观测信号为所述用户语音。
2.根据权利要求1所述的方法,其特征在于,所述检测唤醒信号,包括:
检测采集到的音频信号是否为语音信号;
若采集到的音频信号为语音信号,检测所述语音信号是否包含预设的唤醒词;
若所述语音信号包括所述唤醒词,确定检测到唤醒信号。
3.根据权利要求1所述的方法,其特征在于,所述检测到所述唤醒信号后,测量声源的距离信息,包括:
计算所述声源的方位;
调用和所述声源的方位匹配的测距传感器测量声源的距离信息。
4.根据权利要求1所述的方法,其特征在于,所述语音增强算法还包括波束形成算法和/或增益算法。
5.根据权利要求4所述的方法,其特征在于,优化所述波束形成算法的过程包括:
若所述声源的距离信息小于或等于预设的距离阈值,基于近场模型合并多通道的所述用户语音,所述距离阈值根据所述声源的最小波长和所述智能终端的麦克风阵列的阵列孔径确定;
若所述声源的距离信息大于所述距离阈值,基于远场模型合并多通道的所述用户语音。
6.根据权利要求4所述的方法,其特征在于,优化所述增益算法的过程包括:
根据所述声源的距离信息和预设的标准距离,计算得到所述用户语音的衰减量,所述用户语音的衰减量用于确定所述增益算法的补偿量。
7.根据权利要求1至6任意一项所述的方法,其特征在于,所述根据所述声源的距离信息优化语音识别算法包括:
将所述声源的距离信息所属的距离区间确定为目标距离区间;
利用适用于所述目标距离区间的语音识别模型识别所述增强用户语音。
8.根据权利要求7所述的方法,其特征在于,所述智能终端配置有多个语音识别模型,不同的所述语音识别模型适用于不同的距离区间;
所述语音识别模型,利用适用的距离区间内录制的实录数据,以及模拟适用的距离区间的模拟数据训练得到。
9.一种电子设备,其特征在于,包括存储器和一个或多个处理器;
所述存储器用于存储计算机程序;
所述一个或多个处理器用于执行所述计算机程序,具体用于实现如权利要求1至8任意一项所述的语音识别的方法。
10.一种计算机存储介质,其特征在于,用于存储计算机程序,所述计算机程序被执行时,具体用于实现如权利要求1至8任意一项所述的语音识别的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京荣耀终端有限公司,未经北京荣耀终端有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210372646.7/1.html,转载请声明来源钻瓜专利网。