[发明专利]语音识别模型的训练方法、语音误识别的检测方法及设备有效
申请号: | 202210223449.9 | 申请日: | 2022-03-09 |
公开(公告)号: | CN114360521B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 李杰;王广新;杨汉丹 | 申请(专利权)人: | 深圳市友杰智新科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/10;G10L15/16 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;陈秋波 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 模型 训练 方法 检测 设备 | ||
本申请提供了一种语音识别模型的训练方法、语音误识别的检测方法及设备,在模型训练阶段,基础网络和分类层为现有的识别网络结构,嵌入层作为一个新的插件加入到原有的识别网络结构中,不需要改变原有识别网络结构的框架,易于扩展。且二次模型训练是针对同类、非同类的相似度学习,因此语音识别模型对未见过的样本同样具有识别能力,泛化能力强。在模型应用阶段,通过基础网络和分类层输出的第一识别结果保证基础的识别准确度;并增加第二识别结果与关键词特征向量、非关键词特征向量之间各自对应的特征向量比较,从而判断语音识别模型当前次的识别结果是否更接近预设关键词,以此作为第一识别结果的置信度的判断条件,有效降低了误唤醒率。
技术领域
本申请涉及语音识别技术领域,特别涉及一种语音识别模型的训练方法、语音误识别的检测方法及设备。
背景技术
唤醒词、命令词识别技术在应用时,可以实时监测用户的语音,并在检测到特定词汇时作出相应的反馈(比如检测到唤醒词时唤醒设备)。而在实际应用中,经常会出现相近音、相似音误识别、误唤醒的情况,即用户语音的发音接近唤醒词时,有一定概率被误识别,从而误唤醒设备;此类误识别、误唤醒的情况会给用户带来非常不好的使用体验。现有针对相近音误唤醒的处理,通常是在训练数据中加入负样本,以此来提升训练后的语音识别模型对相近音词汇的识别能力,但这种处理方法,在出现新的相近音时,需要使用新的相近音重新训练语音识别模型,重新训练后的语音识别模型才具备识别新的相近音的能力,方法繁琐,且成本较高。
发明内容
本申请的主要目的为提供一种语音识别模型的训练方法、语音误识别的检测方法及设备,旨在解决现有为解决新的相近音误唤醒需要重新训练语音识别模型,成本较高的弊端。
为实现上述目的,本申请提供了一种语音识别模型的训练方法,包括:
获取第一训练语料和第二训练语料,所述第一训练语料包括预设关键词正样本语料和第一负样本语料,所述第二训练语料包括预设关键词正样本语料、开源命令词正样本语料和第二负样本语料;
将所述第一训练语料和所述第二训练语料按照各自对应阶段依次输入神经网络进行模型训练,其中,所述神经网络包括基础网络、分类层和嵌入层,所述分类层的输入与所述基础网络最后一层的输出相连接,所述嵌入层的输入与所述基础网络最后一层的输出相连接;
在模型训练过程中,使用所述第一训练语料对所述基础网络和所述分类层进行一次模型训练,迭代更新所述基础网络和所述分类层的网络参数,直至模型收敛,得到初始识别模型;
使用所述第二训练语料对所述初始识别模型的基础网络和所述嵌入层进行二次模型训练,所述二次模型训练使用类别间的相似度函数,迭代更新所述嵌入层的网络参数,直至模型收敛,得到语音识别模型。
本申请还提供了一种语音误识别的检测方法,包括:
采集语音数据;
将所述语音数据输入语音识别模型进行处理,分别得到第一识别结果和第二识别结果,其中,所述语音识别模型由如上所述的音唤醒模型的训练方法训练得到,所述第一识别结果为所述语音识别模型中所述分类层的输出,所述第二识别结果为所述语音识别模型中所述嵌入层的输出;
判断所述第一识别结果是否为预设关键词,并判断所述第二识别结果与关键词特征向量之间的第一特征向量距离,是否大于所述第二识别结果与非关键词特征向量之间的第二特征向量距离;
若所述第一识别结果不是所述预设关键词,和/或所述第一特征向量距离大于所述第二特征向量距离,则判定所述语音数据不满足识别条件。
本申请还提供了一种语音识别模型的训练装置,包括:
第一获取模块,用于获取第一训练语料和第二训练语料,所述第一训练语料包括预设关键词正样本语料和第一负样本语料,所述第二训练语料包括预设关键词正样本语料、开源命令词正样本语料和第二负样本语料;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市友杰智新科技有限公司,未经深圳市友杰智新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210223449.9/2.html,转载请声明来源钻瓜专利网。