[发明专利]语音识别方法及相关装置、电子设备、存储介质在审
申请号: | 202210746650.5 | 申请日: | 2022-06-27 |
公开(公告)号: | CN115019773A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 方昕 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/06 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 刘希 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 相关 装置 电子设备 存储 介质 | ||
本申请公开了一种语音识别方法及相关装置、电子设备、存储介质,其中,语音识别方法包括:获取待识别语音所属的目标语种,并获取若干语系各自的语音识别模型;其中,若干语系基于若干归类方式中任一种对样本语音集合中各个样本语音所标注的样本子词序列进行分析得到,若干归类方式至少包括对样本子词序列进行特征聚类,各语系的语音识别模型分别由各语系的样本语音子集合训练得到,且各语系的样本语音子集合由样本语音集合基于归类得到的若干语系划分得到;基于目标语种所属语系对应的语音识别模型,对待识别语音进行识别,得到待识别语音的识别文本。上述方案,能够在降低语音识别模型的应用成本的同时,提升语音识别模型的识别性能。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种语音识别方法及相关装置、电子设备、存储介质。
背景技术
随着深度学习技术在语音识别领域的突破,语音识别已经广泛应用于教育、娱乐、医疗、交通等各行各业。
目前,传统的语音识别系统通常需要为每个语种单独建模,即每个语种需要单独训练得到语音识别模型,并单独部署和维护每个语种的语音识别模型,成本巨大。此外,对于某些低资的语种而言,单独建模得到的语音识别模型,其识别效果也通常较差,无法满足落地要求。有鉴于此,如何在降低语音识别模型的应用成本的同时,提升语音识别模型的识别性能,成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种语音识别方法及相关装置、电子设备、存储介质,能够在降低语音识别模型的应用成本的同时,提升语音识别模型的识别性能。
为了解决上述技术问题,本申请第一方面提供了一种语音识别方法,包括:获取待识别语音所属的目标语种,并获取若干语系各自的语音识别模型;其中,若干语系基于若干归类方式中任一种对样本语音集合中各个样本语音所标注的样本子词序列进行分析得到,若干归类方式至少包括对样本子词序列进行特征聚类,各语系的语音识别模型分别由各语系的样本语音子集合训练得到,且各语系的样本语音子集合由样本语音集合基于归类得到的若干语系划分得到;基于目标语种所属语系对应的语音识别模型,对待识别语音进行识别,得到待识别语音的识别文本。
为了解决上述技术问题,本申请第二方面提供了一种语音识别装置,包括:语种获取模块、模型获取模块和识别模块,语种获取模块,用于获取待识别语音所属的目标语种;模型获取模块,用于获取若干语系各自的语音识别模型;其中,若干语系基于若干归类方式中任一种对样本语音集合中各个样本语音所标注的样本子词序列进行分析得到,若干归类方式至少包括对样本子词序列进行特征聚类,各语系的语音识别模型分别由各语系的样本语音子集合训练得到,且各语系的样本语音子集合由样本语音集合基于归类得到的若干语系划分得到;识别模块,用于基于目标语种所属语系对应的语音识别模型,对待识别语音进行识别,得到待识别语音的识别文本。
为了解决上述技术问题,本申请第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面的语音识别方法。
为了解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面的语音识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210746650.5/2.html,转载请声明来源钻瓜专利网。