[发明专利]语音识别方法、装置、电子设备及计算机可读存储介质在审
申请号: | 202011263629.7 | 申请日: | 2020-11-12 |
公开(公告)号: | CN114495944A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 汪洋;赵鹏程 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L15/32 | 分类号: | G10L15/32;G10L15/08;G06F40/289;G06F16/35 |
代理公司: | 北京智信四方知识产权代理有限公司 11519 | 代理人: | 刘真 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 电子设备 计算机 可读 存储 介质 | ||
1.一种语音识别方法,包括:
获取待识别语音数据,将所述待识别语音数据输入至预先训练得到的第一语音识别模型中进行语音识别,得到一个或多个第一语音识别结果及其对应的第一语音识别评价分值;
响应于检测到预先设置有专项语音识别模型,将所述待识别语音数据输入至所述专项语音识别模型中,得到一个或多个第二语音识别结果及其对应的第二语音识别评价分值;
基于所述第一语音识别评价分值和第二语音识别评价分值对于所述第一语音识别结果和第二语音识别结果进行混合排序,得到目标语音识别结果。
2.根据权利要求1所述的方法,还包括:
基于训练数据训练得到所述专项语音识别模型。
3.根据权利要求2所述的方法,所述基于训练数据训练得到所述专项语音识别模型,包括:
基于语料训练数据训练得到框架语音识别模型;
基于专项词语集合训练得到专项语音识别资源;
融合所述框架语音识别模型和所述专项语音识别资源得到融合语音识别模型;
为所述融合语音识别模型添加拼音元素,得到所述专项语音识别模型。
4.根据权利要求3所述的方法,所述基于语料训练数据训练得到框架语音识别模型,包括:
获取语料训练数据;
对于所述语料训练数据进行类别处理,得到类别语料训练数据;
对于所述语料训练数据和类别语料训练数据进行分词处理得到语料分词训练数据;
基于所述语料训练数据进行基于后验概率的模型训练得到所述框架语音识别模型。
5.根据权利要求4所述的方法,所述对于所述语料训练数据进行类别处理,包括:
将所述语料训练数据中的类别内容替换为类别标识信息,其中,所述类别标识信息对应一个或多个类别内容。
6.根据权利要求5所述的方法,所述基于专项词语集合训练得到专项语音识别资源,包括:
获取专项词语集合,其中,所述专项词语集合与所述待识别语音数据从属方相对应;
确定所述专项词语集合中专项词语所属类别;
对于所述专项词语和专项词语所属类别进行分词处理得到类别分词训练数据;
基于所述类别分词训练数据进行基于后验概率的模型训练得到与所述类别标识信息对应的专项语音识别资源,其中,所述专项语音识别资源包括类别标识信息以及与其对应的文字内容。
7.根据权利要求5或6所述的方法,所述融合所述框架语音识别模型和所述专项语音识别资源得到融合语音识别模型,包括:
将所述框架语音识别模型中的类别标识信息替换为所述专项语音识别资源中与所述类别标识信息对应的文字内容。
8.根据权利要求3-7任一所述的方法,所述为所述融合语音识别模型添加拼音元素,得到所述专项语音识别模型,包括:
为所述融合语音识别模型中的文字添加拼音,得到所述专项语音识别模型。
9.根据权利要求1-8任一所述的方法,所述基于所述第一语音识别评价分值和第二语音识别评价分值对于所述第一语音识别结果和第二语音识别结果进行混合排序,得到目标语音识别结果,包括:
基于所述第一语音识别评价分值和第二语音识别评价分值对于所述第一语音识别结果和第二语音识别结果进行混合排序;
将语音识别评价分值最高的语音识别结果作为目标语音识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011263629.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自启式智能垃圾称重台
- 下一篇:一种高强度耐寒电缆及其制作工艺