[发明专利]语音识别模型的优化方法、训练方法、设备及介质在审
| 申请号: | 202210084139.3 | 申请日: | 2022-01-25 |
| 公开(公告)号: | CN114120979A | 公开(公告)日: | 2022-03-01 |
| 发明(设计)人: | 高欢;王志超 | 申请(专利权)人: | 荣耀终端有限公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/183;G10L15/22 |
| 代理公司: | 上海音科专利商标代理有限公司 31267 | 代理人: | 贾玉 |
| 地址: | 518040 广东省深圳市福田区香蜜湖街道*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 模型 优化 方法 训练 设备 介质 | ||
1.一种语音识别模型的优化方法,应用于电子设备,其特征在于,包括:
获取在电子设备的使用过程中,接收用户语音所产生的、对应于同一期望语音指令且满足预设条件的M个历史语音数据;
基于所述M个历史语音数据、以及各所述历史语音数据对应的期望语音指令,对所述语音识别模型进行优化;
其中M为大于2的整数。
2.根据权利要求1所述的语音识别模型的优化方法,其特征在于,所述预设条件与:所述历史语音数据输入所述语音识别模型后得到的输出结果和所述历史语音数据的数量M相关。
3.根据权利要求2所述的语音识别模型的优化方法,其特征在于,所述语音识别模型包括声学模型,并且所述预设条件包括:
所述历史语音数据输入所述声学模型后,声学模型输出的概率值或概率得分大于优化输出阈值;并且M大于预设数量阈值。
4.根据权利要求1所述的语音识别模型的优化方法,其特征在于,所述期望语音指令包括唤醒指令,并且所述语音识别模型包括唤醒模型。
5.根据权利要求1所述的语音识别模型的优化方法,其特征在于,所述期望语音指令包括命令指令,并且所述语音识别模型包括命令模型。
6.根据权利要求5所述的语音识别模型的优化方法,其特征在于,所述命令模型包括对应多个场景的多个命令子模型;并且所述基于所述M个历史语音数据、以及各所述历史语音数据对应的期望语音指令,对所述语音识别模型进行优化,包括:
确定所述历史语音数据对应的场景;
将所述历史语音数据输入对应的场景的命令子模型,并将所述命令子模型的输出与所述期望语音指令进行比对;
根据所述比对的结果对所述命令子模型的模型参数进行调整。
7.根据权利要求6所述的语音识别模型的优化方法,其特征在于,所述多个场景包括视频播放场景、音乐播放场景、驾驶场景、以及来电场景。
8.根据权利要求6所述的语音识别模型的优化方法,其特征在于,所述多个命令子模型是通过以下训练方式得到的:
获取对应所述多个场景的多个命令语音数据集;
采用所述多个命令语音数据集,分别对通用语音模型进行训练,得到所述多个命令子模型。
9.根据权利要求1至8任一项所述的语音识别模型的优化方法,其特征在于,还包括:
基于优化后的语音识别模型对用户当前输入的语音进行语音识别。
10.一种语音识别模型的训练方法,应用于电子设备,其特征在于,所述语音识别模型包括多个场景子模型;
所述训练方法包括:
获取样本语音数据集,其中,所述样本语音数据集包括多个场景下的样本语音数据;
采用与各场景子模型的场景对应的样本语音数据对所述各场景子模型进行训练。
11.根据权利要求10所述的语音识别模型的训练方法,其特征在于,所述样本语音数据集包括唤醒场景下的唤醒样本语音数据,并且所述多个场景子模型包括唤醒子模型;并且所述采用与各场景子模型的场景对应的样本语音数据对所述各场景子模型进行训练,包括:
采用所述唤醒场景下的唤醒样本语音数据对所述唤醒子模型进行训练。
12.根据权利要求10所述的语音识别模型的训练方法,其特征在于,所述样本语音数据集包括多个场景下的命令样本语音数据,所述多个场景子模型包括多个命令场景子模型;并且所述采用与各场景子模型的场景对应的样本语音数据对所述各场景子模型进行训练,包括:
采用与所述命令场景子模型对应的命令样本语音数据对所述命令场景子模型进行训练。
13.根据权利要求10至12任一项所述的语音识别模型的训练方法,其特征在于,所述场景子模型包括声学模型部分、对齐模型部分和语言模型部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于荣耀终端有限公司,未经荣耀终端有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210084139.3/1.html,转载请声明来源钻瓜专利网。





