[发明专利]语音识别模型的训练方法、语音误识别的检测方法及设备有效
申请号: | 202210223449.9 | 申请日: | 2022-03-09 |
公开(公告)号: | CN114360521B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 李杰;王广新;杨汉丹 | 申请(专利权)人: | 深圳市友杰智新科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/10;G10L15/16 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;陈秋波 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 模型 训练 方法 检测 设备 | ||
1.一种语音识别模型的训练方法,其特征在于,包括:
获取第一训练语料和第二训练语料,所述第一训练语料包括预设关键词正样本语料和第一负样本语料,所述第二训练语料包括预设关键词正样本语料、开源命令词正样本语料和第二负样本语料;
将所述第一训练语料和所述第二训练语料按照各自对应阶段依次输入神经网络进行模型训练,其中,所述神经网络包括基础网络、分类层和嵌入层,所述分类层的输入与所述基础网络最后一层的输出相连接,所述嵌入层的输入与所述基础网络最后一层的输出相连接;
在模型训练过程中,使用所述第一训练语料对所述基础网络和所述分类层进行一次模型训练,迭代更新所述基础网络和所述分类层的网络参数,直至模型收敛,得到初始识别模型;
使用所述第二训练语料对所述初始识别模型的基础网络和所述嵌入层进行二次模型训练,所述二次模型训练使用类别间的相似度函数,迭代更新所述嵌入层的网络参数,直至模型收敛,得到语音识别模型。
2.根据权利要求1所述的语音识别模型的训练方法,其特征在于,所述使用所述第二训练语料对所述初始识别模型的基础网络和所述嵌入层进行二次模型训练,所述二次模型训练使用类别间的相似度函数,迭代更新所述嵌入层的网络参数,直至模型收敛,得到语音识别模型的步骤,包括:
S401:从所述第二训练语料中随机选择第一预设数量个类别的样本语料,并从各所述类别的样本语料中分别随机选择第二预设数量个第一样本语料作为支持集,以及选择第三预设数量个第二样本语料作为查询集,其中,所述第二预设数量小于所述第三预设数量,所述第二预设数量和所述第三预设数量的总和等于当前次选择的一个类别的样本语料的总数量;
S402:将各所述支持集和各所述查询集作为同一批次的训练数据输入所述初始识别模型的基础网络和所述嵌入层进行二次模型训练;
S403:根据各所述支持集构建各所述类别的样本语料各自对应的模板特征向量,并分别计算各所述查询集的各个第二样本语料对应的样本特征向量与各所述模板特征向量之间的特征向量距离,其中,单个所述样本特征向量对应所述第一预设数量个所述特征向量距离;
S404:分别对各所述样本特征向量各自对应的所有特征向量距离做归一化处理,得到各所述样本特征向量分别对应的第一loss值;
S405:对各所述第一loss值做求均计算,得到所述同一批次的训练数据对应的第二loss值;
S406:循环步骤S401—S405,直至分类准确率不再上升,或者在预设训练次数内所述第二loss值不再下降,则判定模型收敛,得到所述语音识别模型。
3.根据权利要求2所述的语音识别模型的训练方法,其特征在于,所述根据各所述支持集构建各所述类别的样本语料各自对应的模板特征向量的步骤中,单个所述类别的样本语料对应的模板特征向量的构建步骤,包括:
将所述支持集中各所述第一样本语料依次通过所述初始识别模型的基础网络和所述嵌入层的处理,分别映射为各自对应的支持集样本特征向量;
对各所述支持集样本特征向量做求均计算,得到所述模板特征向量。
4.一种语音误识别的检测方法,其特征在于,包括:
采集语音数据;
将所述语音数据输入语音识别模型进行处理,分别得到第一识别结果和第二识别结果,其中,所述语音识别模型由权利要求1—3任一所述的语音识别模型的训练方法训练得到,所述第一识别结果为所述语音识别模型中所述分类层的输出,所述第二识别结果为所述语音识别模型中所述嵌入层的输出;
判断所述第一识别结果是否为预设关键词,并判断所述第二识别结果与关键词特征向量之间的第一特征向量距离,是否大于所述第二识别结果与非关键词特征向量之间的第二特征向量距离;
若所述第一识别结果不是所述预设关键词,和/或所述第一特征向量距离大于所述第二特征向量距离,则判定所述语音数据不满足识别条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市友杰智新科技有限公司,未经深圳市友杰智新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210223449.9/1.html,转载请声明来源钻瓜专利网。