[发明专利]语音识别模型调整方法和装置在审
申请号: | 202011285306.8 | 申请日: | 2020-11-17 |
公开(公告)号: | CN114582320A | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 李锦珂;丁小飞 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/10;G10L15/16;G10L25/24;G06N3/04;G06N3/08 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 张阳 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 模型 调整 方法 装置 | ||
公开了一种语音识别模型调整方法和装置。所述方法包括:根据语音识别模型提取的语音特征和语言模型生成多条优选路径;计算所述多条优选路径的字错误数;基于所述字错误数,更新所述语音识别模型的参数;以及所述语音识别模型基于更新的参数提取更新的语音特征,用于结合所述语言模型基于所述更新的语音特征生成的更新的多条优选路径。本发明通过交替进行生成多条优选路径(N‑Best)和更新参数的迭代,能够让计算出的期望字错误数更接近当前模型的真实情况,从而提升优化效果。
技术领域
本公开涉及一种语音处理领域,尤其涉及一种语音识别模型调整方法和装置。
背景技术
语音识别是一种自动将人类的语音内容转换为相应的文字的技术。近年来,随着深度学习的发展,语音识别模型的识别准确率得到大幅提升,并且在诸多领域得到广泛应用。例如,作为智能家庭控制入口的智能音箱,就配备有以语音识别为基础的语音交互能力。
由于高性能语音识别模型通常由深度神经网络(DNN)实现,训练模型时通常使用交叉熵来作为优化函数。但语音识别结果的评价指标是字错误率,即识别文本和实际文本的编辑距离。因此,最小化交叉熵和最小化字错误率之间存在不匹配,导致优化效果欠佳。
为此,需要一种改进的语音识别模型调整方案。
发明内容
本公开要解决的一个技术问题是提供一种改进的语音识别模型调整方案,该方案通过交替进行生成多条优选路径(N-Best)和更新参数的迭代,能够让计算出的期望字错误数更接近当前模型的真实情况,从而提升优化效果。
根据本公开的第一个方面,提供了一种语音识别模型调整方法,包括:根据语音识别模型提取的语音特征和语言模型生成多条优选路径;计算所述多条优选路径的字错误数;基于所述字错误数,更新所述语音识别模型的参数;以及所述语音识别模型基于更新的参数提取更新的语音特征,用于结合所述语言模型基于所述更新的语音特征生成的更新的多条优选路径。
根据本公开的第二个方面,提供了一种语音识别模型调整装置,包括:路径生成单元,用于根据语音识别模型提取的语音特征和语言模型生成多条优选路径;函数计算单元,用于计算所述多条优选路径的字错误数;参数调整单元,用于基于所述字错误数,更新所述语音识别模型的参数,其中所述语音识别模型基于更新的参数提取更新的语音特征,用于结合所述语言模型基于所述更新的语音特征生成的更新的多条优选路径。
根据本公开的第三个方面,提供了一种语音识别设备,包括:声音采集模块,用于采集声音信息;特征提取模块,用于提取采集的声音信息中所包含的语音特征;语音识别模块,用于识别语音特征中的语义;反馈模块,用于基于识别的语义进行反馈,其中,所述特征提取模块提取的语音特征送入如本发明第一方面所述得到的语音识别模型,以获取表示所述语义的文本。
根据本公开的第四个方面,提供了一种物联网设备,包括:声音采集模块,用于采集声音信息;语音识别模块,用于识别语音特征中的语义;执行模块,用于基于识别的语义执行相应操作;联网模块,用于将从采集的声音信息送入如本发明第一方面所述得到的语音识别模型,以获取表示所述语义的文本。
根据本公开的第五个方面,提供了一种语音交互系统,包括:根据第三方面所述的多个语音交互设备;和/或根据第四方面所述的多个物联网设备;以及其上布置有根据本发明第一方面得到的语音识别模型的服务器。
根据本公开的第六个方面,提供了一种计算设备,包括:处理器;以及存储器,其上存储有可执行代码,当可执行代码被处理器执行时,使处理器执行如上述第一方面所述的方法。
根据本公开的第七个方面,提供了一种非暂时性机器可读存储介质,其上存储有可执行代码,当可执行代码被电子设备的处理器执行时,使处理器执行如上述第一方面所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011285306.8/2.html,转载请声明来源钻瓜专利网。