[发明专利]语音识别方法、装置、电子设备和存储介质在审
申请号: | 202210255584.1 | 申请日: | 2022-03-15 |
公开(公告)号: | CN114708852A | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 杨军;方磊;桑宏报;胡鹏;何雪;周振昆;宣璇;方四安;柳林 | 申请(专利权)人: | 合肥讯飞数码科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/26;G10L15/06;G10L15/28 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 程琛 |
地址: | 230088 安徽省合肥市(安徽)自由贸易试*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 电子设备 存储 介质 | ||
本发明提供一种语音识别方法、装置、电子设备和存储介质,所述方法包括:将待识别语音的语音特征输入至语音识别模型,得到语音识别模型输出的识别文本;语音识别模型是基于领域样本语音的标签识别文本和第一识别文本之间的差异,以及第一识别文本和第二识别文本之间的差异,对学生模型进行参数迭代得到的;第一识别文本是学生模型基于领域样本语音的语音特征确定的,第二识别文本是教师模型基于领域样本语音的语音特征确定的,教师模型基于通用样本语音及其标签识别文本训练得到。本发明提供的语音识别方法、装置、电子设备和存储介质,在特定领域场景下能够准确进行语音识别。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音识别方法、装置、电子设备和存储介质。
背景技术
随着人工智能技术的迅速发展,语音识别技术在教育、娱乐、医疗、交通等各领域得到的广泛应用。
目前,多通过采集通用场景下的大量语料数据训练得到语音识别模型,并基于语音识别模型进行语音识别。然而,该语音识别模型应用于特定领域场景下时,语音识别精度较低。
发明内容
本发明提供一种语音识别方法、装置、电子设备和存储介质,用以解决现有技术中在特定领域场景下语音识别精度较低的缺陷。
本发明提供一种语音识别方法,包括:
确定待识别语音;
将所述待识别语音的语音特征输入至语音识别模型,得到所述语音识别模型输出的识别文本;
所述语音识别模型是基于领域样本语音的标签识别文本和第一识别文本之间的差异,以及所述第一识别文本和第二识别文本之间的差异,对学生模型进行参数迭代得到的;
所述第一识别文本是所述学生模型基于所述领域样本语音的语音特征确定的,所述第二识别文本是教师模型基于所述领域样本语音的语音特征确定的,所述教师模型基于通用样本语音及其标签识别文本训练得到。
根据本发明提供的一种语音识别方法,所述语音识别模型的训练步骤包括:
对所述领域样本语音的语音特征进行扰动,并将扰动后的领域样本语音的语音特征输入至所述学生模型,得到所述学生模型输出的所述第一识别文本;
将所述领域样本语音的语音特征输入至所述教师模型,得到所述教师模型输出的所述第二识别文本;
基于领域样本语音的标签识别文本和第一识别文本之间的差异,以及所述第一识别文本和第二识别文本之间的差异,对学生模型进行参数迭代,得到所述语音识别模型;
所述学生模型的初始化参数基于所述通用样本语音及其标签识别文本迭代得到。
根据本发明提供的一种语音识别方法,所述基于领域样本语音的标签识别文本和第一识别文本之间的差异,以及所述第一识别文本和第二识别文本之间的差异,对学生模型进行参数迭代,得到所述语音识别模型,包括:
基于领域样本语音的标签识别文本和第一识别文本之间的差异,确定第一损失值;
基于所述第一识别文本和第二识别文本之间的差异,确定第二损失值;
基于所述第一损失值和所述第二损失值,对所述学生模型进行参数迭代,得到所述语音识别模型。
根据本发明提供的一种语音识别方法,所述领域样本语音的标签识别文本的确定步骤包括:
将所述领域样本语音的语音特征输入至所述学生模型,得到所述学生模型输出的第一标签识别文本;
将所述领域样本语音的语音特征输入至通用语音识别模型,得到所述通用语音识别模型输出的第二标签识别文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥讯飞数码科技有限公司,未经合肥讯飞数码科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210255584.1/2.html,转载请声明来源钻瓜专利网。