[发明专利]语音识别模型的训练方法、语音识别方法、装置和设备在审
申请号: | 201911384482.4 | 申请日: | 2019-12-28 |
公开(公告)号: | CN113129867A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 汪海涛 | 申请(专利权)人: | 中移(上海)信息通信科技有限公司;中国移动通信集团有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/20;G10L25/24 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 赵秀芹 |
地址: | 201260 上海市浦东新区中国(*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 模型 训练 方法 装置 设备 | ||
本发明实施例公开了一种语音识别模型的训练方法、语音识别方法、装置和设备,该方法包括:根据目标对象的音频数据,确定语音训练样本,语音训练样本包括语义信息和音频特征信息;将语义信息和音频特征信息输入到语音识别模型中,对语音识别模型进行迭代训练,直至满足预设训练条件,得到训练后的目标语音识别模型。以解决相关技术中,声纹识别精度不高的问题。
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种语音识别模型的 训练方法、语音识别方法、装置、终端设备和存储介质。
背景技术
声纹识别(Speaker Recognition)是通过计算机利用人体所固有的生理 特征或行为特征来进行个人身份鉴定。声纹识别分为说话人辨认和说话人 确认,前者是根据说话人语音在多个参考说话人中确定为某一个;后者是 证实说话人的身份与其声纹是否一致。
目前,在说话人辨认的过程中,由于检测过程不完备,会使对话被分 割成多个语音片段,每个语音片段包含多个人声,这样,会使分辨具体某 个人声的准确度降低。另外,如果要确认与目标说话人相关的说话内容, 就需要获取大量的音频片段,才能找到目标说话人的前后说话内容,这样, 在语句的先后顺序出现错乱时,导致无法证实说话人的身份与其声纹是否 一致。
发明内容
本发明实施例提供一种语音识别模型的训练方法、语音识别方法、装 置、终端设备及存储介质,以解决相关技术中,声纹识别精度不高的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种语音识别模型的训练方法,该方 法包括:
根据目标对象的音频数据,确定语音训练样本,语音训练样本包括语 义信息和音频特征信息;
将语义信息和音频特征信息输入到语音识别模型中,对所述语音识别 模型进行迭代训练,直至满足预设训练条件,得到训练后的目标语音识别 模型。
本发明实施例中,通过对音频数据进行分析,得到音频数据对应的语 义信息和音频特征信息;接着,根据语义信息和音频特征信息对语音识别 模型进行训练,这样,即使在对话音频被分成多个片段时,也能根据音频 特征信息确定目标对象,且根据语义信息识别到目标对象的身份特征,以 便对目标对象在对话音频中被准确追踪,从而提高在音频中识别目标对象 的精度,并在识别出目标对象的情况下,确定目标对象的身份信息,从而 得到对话音频的应用场景。
在一种可能的实施例中,上述涉及到的“将语义信息和音频特征信息 输入到语音识别模型中,对语音识别模型进行迭代训练,直至满足预设训 练条件,得到训练后的目标语音识别模型”的步骤中,具体可以包括:
针对每个语音训练样本分别执行以下步骤:将语义信息和音频特征信 息输入到语音识别模型中,得到语义信息与音频特征信息的相似度预测结 果;
根据每个相似度预测结果对语音识别模型进行调整;
根据语音训练样本对调整后的语音识别模型进行迭代训练,直至满足 预设训练条件,得到训练后的目标语音识别模型。
在另一种可能的实施例中,本发明实施例中的“语音识别模型”可以 包括转录网络模型,基于此,在上述“根据目标对象的音频数据,确定语 音训练样本”的步骤中,具体可以包括:
将音频数据的音频特征向量输入到转录网络模型中,得到语义信息;
其中,语音信息用于确定音频数据对应的文本数据。
在又一种可能的实施例中,本发明实施例中的“语音识别模型”可以 包括预测网络模型,基于此,在上述“根据目标对象的音频数据,确定语 音训练样本”的步骤中,具体可以包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(上海)信息通信科技有限公司;中国移动通信集团有限公司,未经中移(上海)信息通信科技有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911384482.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种磷石膏固体废弃物自流平砂浆及其制备方法
- 下一篇:光伏接线盒与光伏组件