[发明专利]一种语音识别模型训练方法、装置和可读存储介质有效
申请号: | 202210815593.1 | 申请日: | 2022-07-12 |
公开(公告)号: | CN114882873B | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 钟雨崎;凌明;杨作兴;艾国 | 申请(专利权)人: | 深圳比特微电子科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/08;G10L15/26 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 518051 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 模型 训练 方法 装置 可读 存储 介质 | ||
本发明实施例提供了一种语音识别模型训练方法、装置和可读存储介质。所述方法包括:将当前迭代的语音样本进行等份切分得到第一语音片段序列,从中随机选取预设比例的语音片段得到第二语音片段序列,分别输入第一提取器得到第一特征组和第二特征组;对第二特征组填充预置向量;将第一特征组输入表示器处理得到第一向量组;将填充后的第二特征组输入第二提取器处理得到第二向量组;根据第一向量组和第二向量组计算第一损失值,并调整第一提取器、第二提取器和表示器的参数,进行迭代训练;基于训练样本集中的语音样本和语音样本对应的标签数据,利用训练完成的特征提取器训练分类器。本发明可以利用少量的标注数据训练识别准确的语音识别模型。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音识别模型训练方法、装置和可读存储介质。
背景技术
随着人工智能的快速发展,语音识别技术得到了广泛应用。例如手机中的语音转文字功能,又如,以语音为智能交互的智能家居应用等,都需要使用语音识别技术。
语音识别模型的准确度直接影响语音识别的效果,训练语音识别模型需要收集特定语种的语音数据,再由人工进行数据标注,得到训练数据。训练数据的数据量越多,训练得到的语音识别模型的效果越好。
然而,如果需要训练可以识别小语种的语音识别模型,需要收集小语种的语音数据,并进行人工标注。但是小语种的语音数据数量较少,收集较为困难,且采用人工进行标注的成本较高,因此,亟需一种高效的利用少量的标注数据训练识别准确的语音识别模型,例如,对于小语种语音识别模型的训练方法。
发明内容
本发明实施例提供一种语音识别模型训练方法、装置和可读存储介质,可以利用少量的标注数据训练识别准确的语音识别模型。
第一方面,本发明实施例公开了一种语音识别模型训练方法,所述方法用于基于训练样本集训练语音识别模型,所述语音识别模型包括特征提取器和分类器,所述特征提取器包括第一提取器和第二提取器,所述训练样本集包括多个语音样本和每个语音样本对应的标签数据,所述方法包括:
从所述训练样本集中获取当前迭代的语音样本,将当前迭代的语音样本进行等份切分得到第一语音片段序列,从所述第一语音片段序列中随机选取预设比例的语音片段得到第二语音片段序列;
将所述第一语音片段序列输入所述第一提取器进行处理,得到第一特征组,以及将所述第二语音片段序列输入所述第一提取器进行处理,得到第二特征组;
在所述第二特征组中填充预置向量,使得填充后的第二特征组与所述第一特征组的长度相等;
将所述第一特征组输入表示器进行处理,得到第一向量组,以及将所述填充后的第二特征组输入所述第二提取器进行处理,得到第二向量组;
根据所述第一向量组和所述第二向量组计算第一损失值,根据所述第一损失值分别调整所述第一提取器、所述第二提取器、以及所述表示器的参数,进入下一轮迭代,在到达迭代停止条件时得到训练完成的特征提取器;
基于所述训练样本集中的语音样本和语音样本对应的标签数据,利用所述训练完成的特征提取器训练所述分类器。
第二方面,本发明实施例公开了一种语音识别方法,所述方法包括:
获取待识别的语音信号;
将所述语音信号输入训练完成的语音识别模型,由所述语音识别模型输出所述语音信号对应的语音识别结果;其中,所述语音识别模型根据上述一个或多个所述的语音识别模型训练方法训练得到。
第三方面,本发明实施例公开了一种语音识别模型训练装置,所述装置用于基于训练样本集训练语音识别模型,所述语音识别模型包括特征提取器和分类器,所述特征提取器包括第一提取器和第二提取器,所述训练样本集包括多个语音样本和每个语音样本对应的标签数据,所述装置包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳比特微电子科技有限公司,未经深圳比特微电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210815593.1/2.html,转载请声明来源钻瓜专利网。