[发明专利]语音识别方法、装置及计算机可读存储介质在审
申请号: | 202111669746.8 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114283786A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 颜宋宋;许丽;尤祖寰;熊世富 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/02;G10L15/06;G10L15/16 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 刘希 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 计算机 可读 存储 介质 | ||
本申请公开了一种语音识别方法、装置及计算机可读存储介质。其中,该方法包括:获取待识别语音信息;利用编码网络中的至少两个子编码网络分别对所述语音信息进行特征提取,获得至少两个语音特征;其中,每个所述子编码网络根据相应语种的样本数据训练得到;利用融合网络将所述至少两个语音特征进行融合,得到融合语音特征;利用解码网络对所述融合语音特征进行解码,得到语音识别结果。通过上述方式,本申请能够提高语音识别的准确度。
技术领域
本申请涉及语音识别领域,特别是涉及一种语音识别方法、装置及计算机可读存储介质。
背景技术
语音识别通过机器学习方法让机器能够自动的将语音转换成对应的文字,从而赋予了机器类似人听觉的功能,是人工智能的重要组成部分。
自十年前采用基于深度神经网络的混合建模以来,自动语音识别的准确性得到了显著提高。随着人工智能技术的不断突破和各种智能终端设备的日益普及,语音识别作为人机交互的重要环节,广泛应用于各种智能终端上,越来越多的用户习惯用语音输入。这一突破利用DNN取代了传统的高斯混合模型进行声学似然评价,同时仍然保留了声学模型、语言模型、词汇模型等所有组件作为混合ASR系统。
发明内容
本申请主要提供一种语音识别方法、装置及计算机可读存储介质,解决了现有技术中语音识别准确度低的问题。
为解决上述技术问题,本申请第一方面提供了语音识别方法,包括:获取待识别语音信息;利用编码网络中的至少两个子编码网络分别对所述语音信息进行特征提取,获得至少两个语音特征;其中,每个所述子编码网络根据相应语种的样本数据训练得到;利用融合网络将所述至少两个语音特征进行融合,得到融合语音特征;利用解码网络对所述融合语音特征进行解码,得到语音识别结果。
为解决上述技术问题,本申请第二方面提供了语音识别装置,包括:获取模块,用于获取待识别语音信息;编码模块,用于利用编码网络中的至少两个子编码网络分别对所述语音信息进行特征提取,获得至少两个语音特征;其中,每个所述子编码网络根据相应语种的样本数据训练得到;融合模块,用于利用融合网络将所述至少两个语音特征进行融合,得到融合语音特征;解码模块,用于利用解码网络对所述融合语音特征进行解码,得到语音识别结果。
为解决上述技术问题,本申请第三方面提供了语音识别装置,所述装置包括相互耦接的处理器和存储器;所述存储器中存储有计算机程序,所述处理器用于执行所述计算机程序以实现如上述第一方面提供的语音识别方法。
为解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,计算机可读存储介质存储有程序数据,所述程序数据被处理器执行时,实现上述第一方面提供的语音识别方法。
本申请的有益效果是:区别于现有技术的情况,本申请利用编码网络中的至少两个子编码网络分别对所述语音信息进行特征提取,获得至少两个语音特征,其中,每个所述子编码网络根据相应语种的样本数据训练得到,再利用融合网络将所述至少两个语音特征进行融合,得到融合语音特征,最后利用解码网络对所述融合语音特征进行解码,得到语音识别结果,各个子编码网络之间互不影响,提取到的语音特征准确度更高,作用到最终解码,语音识别结果更准确度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请语音识别模型一实施例的结构示意框图;
图2是本申请语音识别模型的训练方法一实施例的流程示意框图;
图3是本申请预设语言识别模型一实施例的结构示意框图;
图4是本申请语音识别方法一实施例的流程示意框图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111669746.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种芯片测试系统
- 下一篇:一种内嵌应用系统插件的水印嵌入方法