[发明专利]语音识别模型的训练方法、语音识别方法、装置和设备在审

专利信息
申请号: 201911384482.4 申请日: 2019-12-28
公开(公告)号: CN113129867A 公开(公告)日: 2021-07-16
发明(设计)人: 汪海涛 申请(专利权)人: 中移(上海)信息通信科技有限公司;中国移动通信集团有限公司
主分类号: G10L15/06 分类号: G10L15/06;G10L15/20;G10L25/24
代理公司: 北京东方亿思知识产权代理有限责任公司 11258 代理人: 赵秀芹
地址: 201260 上海市浦东新区中国(*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 识别 模型 训练 方法 装置 设备
【说明书】:

发明实施例公开了一种语音识别模型的训练方法、语音识别方法、装置和设备,该方法包括:根据目标对象的音频数据,确定语音训练样本,语音训练样本包括语义信息和音频特征信息;将语义信息和音频特征信息输入到语音识别模型中,对语音识别模型进行迭代训练,直至满足预设训练条件,得到训练后的目标语音识别模型。以解决相关技术中,声纹识别精度不高的问题。

技术领域

本发明实施例涉及数据处理技术领域,尤其涉及一种语音识别模型的 训练方法、语音识别方法、装置、终端设备和存储介质。

背景技术

声纹识别(Speaker Recognition)是通过计算机利用人体所固有的生理 特征或行为特征来进行个人身份鉴定。声纹识别分为说话人辨认和说话人 确认,前者是根据说话人语音在多个参考说话人中确定为某一个;后者是 证实说话人的身份与其声纹是否一致。

目前,在说话人辨认的过程中,由于检测过程不完备,会使对话被分 割成多个语音片段,每个语音片段包含多个人声,这样,会使分辨具体某 个人声的准确度降低。另外,如果要确认与目标说话人相关的说话内容, 就需要获取大量的音频片段,才能找到目标说话人的前后说话内容,这样, 在语句的先后顺序出现错乱时,导致无法证实说话人的身份与其声纹是否 一致。

发明内容

本发明实施例提供一种语音识别模型的训练方法、语音识别方法、装 置、终端设备及存储介质,以解决相关技术中,声纹识别精度不高的问题。

为了解决上述技术问题,本发明是这样实现的:

第一方面,本发明实施例提供了一种语音识别模型的训练方法,该方 法包括:

根据目标对象的音频数据,确定语音训练样本,语音训练样本包括语 义信息和音频特征信息;

将语义信息和音频特征信息输入到语音识别模型中,对所述语音识别 模型进行迭代训练,直至满足预设训练条件,得到训练后的目标语音识别 模型。

本发明实施例中,通过对音频数据进行分析,得到音频数据对应的语 义信息和音频特征信息;接着,根据语义信息和音频特征信息对语音识别 模型进行训练,这样,即使在对话音频被分成多个片段时,也能根据音频 特征信息确定目标对象,且根据语义信息识别到目标对象的身份特征,以 便对目标对象在对话音频中被准确追踪,从而提高在音频中识别目标对象 的精度,并在识别出目标对象的情况下,确定目标对象的身份信息,从而 得到对话音频的应用场景。

在一种可能的实施例中,上述涉及到的“将语义信息和音频特征信息 输入到语音识别模型中,对语音识别模型进行迭代训练,直至满足预设训 练条件,得到训练后的目标语音识别模型”的步骤中,具体可以包括:

针对每个语音训练样本分别执行以下步骤:将语义信息和音频特征信 息输入到语音识别模型中,得到语义信息与音频特征信息的相似度预测结 果;

根据每个相似度预测结果对语音识别模型进行调整;

根据语音训练样本对调整后的语音识别模型进行迭代训练,直至满足 预设训练条件,得到训练后的目标语音识别模型。

在另一种可能的实施例中,本发明实施例中的“语音识别模型”可以 包括转录网络模型,基于此,在上述“根据目标对象的音频数据,确定语 音训练样本”的步骤中,具体可以包括:

将音频数据的音频特征向量输入到转录网络模型中,得到语义信息;

其中,语音信息用于确定音频数据对应的文本数据。

在又一种可能的实施例中,本发明实施例中的“语音识别模型”可以 包括预测网络模型,基于此,在上述“根据目标对象的音频数据,确定语 音训练样本”的步骤中,具体可以包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(上海)信息通信科技有限公司;中国移动通信集团有限公司,未经中移(上海)信息通信科技有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911384482.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top