[发明专利]声纹识别模型训练方法、装置及相关设备有效
申请号: | 202011594311.7 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112820299B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 陈燕丽;王洪斌;蒋宁;吴海英 | 申请(专利权)人: | 马上消费金融股份有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 黄灿;汤明明 |
地址: | 404100 重庆市渝北区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声纹 识别 模型 训练 方法 装置 相关 设备 | ||
本申请提供一种声纹识别模型训练方法、装置及相关设备,方法包括:在样本池中随机选择M个第一声纹样本数据,每一个所述第一声纹样本数据包括被采样的概率值;将所述第一声纹样本数据输入到预训练声纹识别模型,进行第N次迭代训练;基于所述预训练声纹识别模型输出的分类结果确定调整所述第一声纹样本数据的被采样的概率值;在经过第N次迭代训练后的预训练声纹识别模型收敛的情况下,将经过第N次迭代训练后的预训练声纹识别模型确定为声纹识别模型;其中,调整被采样的概率值后的所述第一声纹样本数据用于确定第N+1次迭代训练的输入数据,M和N均为正整数。这样,可以提高训练得到的声纹识别模型训练的精度。
技术领域
本申请涉及声纹识别技术领域,尤其涉及到一种声纹识别模型训练方法、装置及相关设备。
背景技术
声纹识别作为可信的声纹特征认证技术,在身份认证、安全核身等诸多领域和场景中都有广阔的应用前景。但是语音很容易受到各种噪声环境,情绪,身体状况等外部环境和自身因素的影响,因此,提高声纹识别准确率,有着极为重要的现实意义。在实现本申请的过程中,申请人发现现有技术中存在以下技术问题:声纹识别模型训练中,容易受到大规模非平衡数据的干扰,从而导致训练得到的声纹识别模型训练的精度较低。
发明内容
本申请实施例提供一种声纹识别模型训练方法、装置及相关设备,以解决训练得到的声纹识别模型训练的精度较低的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种声纹识别模型训练方法,包括:
在样本池中随机选择M个第一声纹样本数据,每一个所述第一声纹样本数据包括被采样的概率值;
将所述第一声纹样本数据输入到预训练声纹识别模型,进行第N次迭代训练;
基于所述预训练声纹识别模型输出的分类结果确定调整所述第一声纹样本数据的被采样的概率值;
在经过第N次迭代训练后的预训练声纹识别模型收敛的情况下,将经过第N次迭代训练后的预训练声纹识别模型确定为声纹识别模型;
其中,调整被采样的概率值后的所述第一声纹样本数据用于确定第N+1次迭代训练的输入数据,M和N均为正整数。
第二方面,本申请实施例提供了一种声纹识别方法,包括:
获取待识别的第一语音数据对应的声纹数据;
将所述声纹数据输入到声纹识别模型中,获得待确认的声纹特征向量;
将所述声纹特征向量输入至预设的分类模型获得第一分类结果;
在所述第一分类结果与第一用户对应的基准结果匹配的情况下,确定所述第一语音数据为第一用户的语音数据;
其中,所述声纹识别模型基于所述上述所述的声纹识别模型训练方法训练得到。
第三方面,本申请实施例提供了一种声纹识别模型训练装置,包括:
选择模块,用于在样本池中随机选择M个第一声纹样本数据,每一个所述第一声纹样本数据包括被采样的概率值;
训练模块,用于将所述第一声纹样本数据输入到预训练声纹识别模型,进行第N次迭代训练;
第一确定模块,用于基于所述预训练声纹识别模型输出的分类结果确定调整所述第一声纹样本数据的被采样的概率值;
第二确定模块,用于在经过第N次迭代训练后的预训练声纹识别模型收敛的情况下,将经过第N次迭代训练后的预训练声纹识别模型确定为声纹识别模型;
其中,调整被采样的概率值后的所述第一声纹样本数据用于确定第N+1次迭代训练的输入数据,M和N均为正整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司,未经马上消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011594311.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钛铝铬合金靶及其制备方法
- 下一篇:一种管式微滤膜测试装置