[发明专利]语音识别模型的训练方法、装置和计算机设备有效
| 申请号: | 202110059993.X | 申请日: | 2021-01-18 |
| 公开(公告)号: | CN112365886B | 公开(公告)日: | 2021-05-07 |
| 发明(设计)人: | 徐泓洋;王广新;杨汉丹 | 申请(专利权)人: | 深圳市友杰智新科技有限公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16 |
| 代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;曹勇 |
| 地址: | 518000 广东省深圳市南山区招商*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 模型 训练 方法 装置 计算机 设备 | ||
1.一种语音识别模型的训练方法,其特征在于,包括:
对训练集中指定语音语句提取数据帧,其中,所述指定语音语句属于训练集中的任意一语音训练样本;
将所述数据帧按照批次处理数量输入第一模型,得到所述数据帧对应的第一特征帧,将所述数据帧按照所述批次处理数量输入第二模型中,得到所述数据帧对应的第二特征帧,其中,所述第一模型为训练好的大容量语音识别模型,所述第二模型为待训练的小容量语音识别模型;
计算所述第一特征帧对应的第一相似度矩阵,以及所述第二特征帧对应的第二相似度矩阵;
根据所述第一相似度矩阵和所述第二相似度矩阵,计算所述指定语音语句对应的相似度矩阵差异;
根据所述指定语音语句对应的相似度矩阵差异,计算训练集中所有语音语句分别对应的相似度矩阵差异;
根据所有语音语句分别对应的相似度矩阵差异,形成训练所述第二模型的损失函数;
根据所述损失函数在所述训练集上训练所述第二模型。
2.根据权利要求1所述的语音识别模型的训练方法,其特征在于,所述计算所述第一特征帧对应的第一相似度矩阵的步骤,包括:
将各所述第一特征帧矩阵进行转置计算,得到各所述第一特征帧矩阵分别对应的特征帧方阵;
计算第一特征帧方阵分别与各第二特征帧方阵之间的相似度,得到所述第一特征帧对应的第一相似度矩阵,其中,所述第一特征帧方阵属于所有所述第一特征帧对应的特征帧方阵的任意一方阵,所述第二特征帧方阵为所有所述第一特征帧对应的特征帧方阵中除所述第一特征帧方阵之外的特征帧方阵。
3.根据权利要求2所述的语音识别模型的训练方法,其特征在于,所述将所述数据帧按照批次处理数量输入第一模型,得到所述数据帧对应的第一特征帧的步骤,包括:
获取所述第一模型对应的批次计算指标;
根据所述批次计算指标确定所述批次处理数量;
按照所述批次处理数量,依次划窗所述数据帧提取各输入数据;
将各所述输入数据按照在所述指定语音语句中的时序次序,依次输入所述第一模型,得到依次排布的各所述第一特征帧。
4.根据权利要求3所述的语音识别模型的训练方法,其特征在于,所述根据所述第一相似度矩阵和所述第二相似度矩阵,计算所述指定语音语句对应的相似度矩阵差异的步骤,包括:
将所述第一相似度矩阵和所述第二相似度矩阵中的相似度,转换为概率值;
根据转化后的概率值计算KL散度损失;
将所述KL散度损失作为所述指定语音语句对应的相似度矩阵差异。
5.根据权利要求1所述的语音识别模型的训练方法,其特征在于,所述根据所有语音语句分别对应的相似度矩阵差异,形成训练所述第二模型的损失函数的步骤,包括:
将所述相似度矩阵差异作为第一损失;
获取所述第二模型预设的时序分类损失,作为第二损失;
对所述第一损失和所述第二损失求和,得到训练所述第二模型的损失函数。
6.语音识别模型的训练装置,其特征在于,包括:
提取模块,用于对训练集中指定语音语句提取数据帧,其中,所述指定语音语句属于训练集中的任意一语音训练样本;
输入模块,用于将所述数据帧按照批次处理数量输入第一模型,得到所述数据帧对应的第一特征帧,将所述数据帧按照所述批次处理数量输入第二模型中,得到所述数据帧对应的第二特征帧,其中,所述第一模型为训练好的大容量语音识别模型,所述第二模型为待训练的小容量语音识别模型;
第一计算模块,用于计算所述第一特征帧对应的第一相似度矩阵,以及所述第二特征帧对应的第二相似度矩阵;
第二计算模块,用于根据所述第一相似度矩阵和所述第二相似度矩阵,计算所述指定语音语句对应的相似度矩阵差异;
第三计算模块,用于根据所述指定语音语句对应的相似度矩阵差异,计算训练集中所有语音语句分别对应的相似度矩阵差异;
形成模块,用于根据所有语音语句分别对应的相似度矩阵差异,形成训练所述第二模型的损失函数;
训练模块,用于根据所述损失函数在所述训练集上训练所述第二模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市友杰智新科技有限公司,未经深圳市友杰智新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110059993.X/1.html,转载请声明来源钻瓜专利网。





