[发明专利]语音识别方法、装置及计算机可读存储介质在审
申请号: | 202111669746.8 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114283786A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 颜宋宋;许丽;尤祖寰;熊世富 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/02;G10L15/06;G10L15/16 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 刘希 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 计算机 可读 存储 介质 | ||
1.一种语音识别方法,其特征在于,所述方法包括:
获取待识别语音信息;
利用编码网络中的至少两个子编码网络分别对所述语音信息进行特征提取,获得至少两个语音特征;其中,每个所述子编码网络根据相应语种的样本数据训练得到;
利用融合网络将所述至少两个语音特征进行融合,得到融合语音特征;
利用解码网络对所述融合语音特征进行解码,得到语音识别结果。
2.根据权利要求1所述的方法,其特征在于,所述利用编码网络中的至少两个子编码网络分别对所述语音信息进行特征提取,包括:
利用每个所述子编码网络分别执行以下步骤:
获取所述语音信息的时序特征;
根据所述时序特征进行单双向特征提取,以得到所述语音特征。
3.根据权利要求1所述的方法,其特征在于,所述利用融合网络将所述至少两个语音特征进行融合,包括:
对所述至少两个语音特征进行第一融合操作,得到第一融合特征;
基于所述第一融合特征对所述语音信息进行语种分类,得到语种特征;
对所述语音特征和所述语种特征进行第二融合操作,得到所述融合语音特征。
4.根据权利要求3所述的方法,其特征在于,所述对所述至少两个语音特征进行第一融合操作,包括:
利用第一全连接层网络对所述至少两个语音特征进行降维以及拼接操作。
5.根据权利要求3所述的方法,其特征在于,所述对所述语音特征和所述语种特征进行第二融合操作,包括:
将各所述语音特征分别与所述语种特征相乘,得到对应的加权特征;
将所述加权特征进行求和,并利用第二全连接层网络进行维度扩展,得到所述融合语音特征。
6.根据权利要求3所述的方法,其特征在于,所述对所述语音特征和所述语种特征进行第二融合操作,包括:
根据所述语种特征,确定所述语音信息为各所述子编码网络对应语种的概率;
根据所述概率对各所述子编码网络输出的语音特征进行加权融合操作,以得到所述融合语音特征。
7.根据权利要求1所述的方法,其特征在于,所述利用编码网络中的至少两个子编码网络分别对所述语音信息进行特征提取之前,所述方法还包括:
利用至少两种语种的样本数据分别对预设的语言识别模型进行训练;
分别从训练好的所述语言识别模型提取出编码器部分,以作为所述子编码网络;
将所述子编码网络的输出层连接到所述融合网络的输入层。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
在所述子编码网络的参数固定的情况下,利用数据量满足一定均衡度的至少两种语种的样本数据训练所述融合网络和所述编码网络;其中,所述数据量满足一定均衡度是指不同语种的所述样本数据两两之间的数据量差值小于或等于20%。
9.一种语音识别装置,其特征在于,所述装置包括:
获取模块,用于获取待识别语音信息;
编码模块,用于利用编码网络中的至少两个子编码网络分别对所述语音信息进行特征提取,获得至少两个语音特征;其中,每个所述子编码网络根据相应语种的样本数据训练得到;
融合模块,用于利用融合网络将所述至少两个语音特征进行融合,得到融合语音特征;
解码模块,用于利用解码网络对所述融合语音特征进行解码,得到语音识别结果。
10.一种语音识别装置,其特征在于,所述装置包括相互耦接的处理器和存储器;所述存储器中存储有计算机程序,所述处理器用于执行所述计算机程序以实现如权利要求1-8中任一项所述方法的步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有程序数据,所述程序数据被处理器执行时实现如权利要求1-8中任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111669746.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种芯片测试系统
- 下一篇:一种内嵌应用系统插件的水印嵌入方法