[发明专利]基于人工智能的语音识别方法、装置、设备和存储介质在审
| 申请号: | 202210375934.8 | 申请日: | 2022-04-11 |
| 公开(公告)号: | CN114822504A | 公开(公告)日: | 2022-07-29 |
| 发明(设计)人: | 刘博卿;王健宗;张之勇 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/20;G10L15/26 |
| 代理公司: | 深圳国新南方知识产权代理有限公司 44374 | 代理人: | 艾青 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 人工智能 语音 识别 方法 装置 设备 存储 介质 | ||
1.一种语音识别方法,其特征在于,所述方法包括:
对获取的原始语音数据进行降噪处理,得到对应的降噪语音数据;
将所述原始语音数据和降噪语音数据输入至已训练的语音识别效果预测模型进行语音识别效果预测,得到目标后验概率;
根据所述目标后验概率从所述原始语音数据、降噪语音数据和融合语音数据中确定待识别语音数据,其中,所述融合语音数据是利用所述目标后验概率对所述原始语音数据和降噪语音数据进行融合得到的;
对所述待识别语音数据进行语音识别,将得到的目标识别文本作为所述原始语音数据对应的语音识别结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述原始语音数据和降噪语音数据输入至已训练的语音识别效果预测模型进行语音识别效果预测,得到目标后验概率,包括:
对所述原始语音数据进行声学特征提取得到对应的第一声学特征,对所述降噪语音数据进行声学特征提取得到对应的第二声学特征;
对所述第一声学特征和第二声学特征进行特征融合,得到第一融合特征;
根据所述第一融合特征执行语音识别效果预测,得到目标后验概率。
3.根据权利要求1所述的方法,其特征在于,在所述将所述原始语音数据和降噪语音数据输入至已训练的语音识别效果预测模型进行语音识别效果预测,得到目标后验概率之前,所述方法还包括:
获取所述原始语音数据的估计噪音数据,
根据所述降噪语音数据和估计噪音数据计算得到所述原始语音数据对应的信噪比,将所述信噪比输入至所述已训练的语音识别效果预测模型;
所述将所述原始语音数据和降噪语音数据输入至已训练的语音识别效果预测模型进行语音识别效果预测,得到目标后验概率,包括:
对所述原始语音数据进行声学特征提取得到对应的第一声学特征,对所述降噪语音数据进行声学特征提取得到对应的第二声学特征,
对所述第一声学特征和第二声学特征进行第一特征融合,得到第一融合特征,
根据所述第一融合特征执行第一语音识别效果预测,得到中间后验概率,
将所述中间后验概率作为第一中间层特征与作为第二中间层特征的所述信噪比进行第二特征融合,得到第二融合特征,
根据所述第二融合特征执行第二语音识别效果预测,得到目标后验概率。
4.根据权利要求1所述的方法,其特征在于,所述目标后验概率包括第一目标后验概率和第二目标后验概率,所述第一目标后验概率表征对所述原始语音数据的识别效果,所述第二目标后验概率表征对所述降噪语音数据的识别效果,所述第一目标后验概率和第二目标后验概率之和为1;
所述根据所述目标后验概率从所述原始语音数据、降噪语音数据和融合语音数据中确定待识别语音数据,包括:
若所述第一目标后验概率大于所述第二目标后验概率,则确定所述原始语音数据为待识别语音数据,若所述第一目标后验概率小于所述第二目标后验概率,则确定所述降噪语音数据为所述原始语音数据的待识别语音数据;
或,根据所述第一目标后验概率、第二目标后验概率对所述原始语音数据和降噪语音数据进行融合,将融合后得到的语音数据作为所述原始语音数据对应的待识别语音数据。
5.根据权利要求2所述的方法,其特征在于,在所述将所述原始语音数据和降噪语音数据输入至已训练的语音识别效果预测模型进行语音识别效果预测,得到目标后验概率之前,所述方法还包括:
获取不同的已知语音片段及对应的降噪语音片段;
生成每个所述已知语音片段对应的数据标签,根据所述数据标签对对应的训练样本进行打标,其中,每个所述训练样本包括已知语音片段及对应的降噪语音片段,所述数据标签包括第一后验概率和第二后验概率,所述第一后验概率表征对对应已知语音片段的识别效果,所述第二后验概率表征对对应已知语音片段的降噪语音片段的识别效果,所述第一后验概率与第二后验概率之和为1;
利用打标的训练样本对预训练的语音识别效果预测模型进行训练,直至满足收敛条件,得到已训练的语音识别效果预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210375934.8/1.html,转载请声明来源钻瓜专利网。





