[发明专利]声纹识别模型训练方法、装置及相关设备有效
申请号: | 202011594311.7 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112820299B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 陈燕丽;王洪斌;蒋宁;吴海英 | 申请(专利权)人: | 马上消费金融股份有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 黄灿;汤明明 |
地址: | 404100 重庆市渝北区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声纹 识别 模型 训练 方法 装置 相关 设备 | ||
1.一种声纹识别模型训练方法,其特征在于,包括:
在样本池中随机选择M个第一声纹样本数据,每一个所述第一声纹样本数据包括被采样的概率值;
将所述第一声纹样本数据输入到预训练声纹识别模型,进行第N次迭代训练;
基于所述预训练声纹识别模型输出的分类结果确定调整所述第一声纹样本数据的被采样的概率值;
在经过第N次迭代训练后的预训练声纹识别模型收敛的情况下,将经过第N次迭代训练后的预训练声纹识别模型确定为声纹识别模型;
其中,调整被采样的概率值后的所述第一声纹样本数据用于确定第N+1次迭代训练的输入数据,M和N均为正整数。
2.根据权利要求1所述的方法,其特征在于,所述基于所述预训练声纹识别模型输出的分类结果确定调整所述第一声纹样本数据的被采样的概率值,包括:
在所述预训练声纹识别模型输出的分类结果正确的情况下,调低所述第一声纹样本数据的被采样的概率值;
在所述预训练声纹识别模型输出的分类结果错误的情况下,调高所述第一声纹样本数据的被采样的概率值,或者,剔除所述第一声纹样本数据。
3.根据权利要求2所述的方法,其特征在于,所述在所述预训练声纹识别模型输出的分类结果错误的情况下,调高所述第一声纹样本数据的被采样的概率值,或者,剔除所述第一声纹样本数据,包括:
在所述预训练声纹识别模型输出的分类结果错误的情况下,确定所述第一声纹样本数据的目标参数;
在所述目标参数满足预设条件的情况下,调高所述第一声纹样本数据的被采样的概率值;
或者,在所述目标参数不满足预设条件的情况下,剔除所述第一声纹样本数据。
4.根据权利要求2所述的方法,其特征在于,所述将经过第N次迭代训练后的预训练声纹识别模型确定为声纹识别模型之后,所述方法还包括:
随机获取L个声纹样本数据集合,其中,每个所述声纹样本数据集合中包括至少两个用户的声纹样本数据,所述至少两个用户的声纹样本数据的相似度大于第二阈值,L为正整数;
利用所述L个声纹样本数据集合训练所述声纹识别模型;
在经过训练的声纹识别模型收敛的情况下,将经过训练的声纹识别模型确定为目标声纹识别模型。
5.根据权利要求4所述的方法,其特征在于,所述至少两个用户的声纹样本数据包括目标用户的声纹样本数据,所述至少两个用户中除所述目标用户外的其他用户属于所述目标用户的队列中的用户,所述目标用户的队列中的用户的声纹样本数据与所述目标用户的声纹样本数据的相似度大于第二阈值。
6.根据权利要求4所述的方法,其特征在于,所述预训练声纹识别模型为利用全量数据训练之后的声纹识别模型,所述第一声纹样本数据和所述L个声纹样本数据集合包括的声纹样本数据均属于所述全量数据中的数据,所述全量数据为所述样本池中包括的所有的待训练的声纹样本数据。
7.一种声纹识别方法,其特征在于,包括:
获取待识别的第一语音数据对应的声纹数据;
将所述声纹数据输入到声纹识别模型中,获得待确认的声纹特征向量;
将所述声纹特征向量输入至预设的分类模型获得第一分类结果;
在所述第一分类结果与第一用户对应的基准结果匹配的情况下,确定所述第一语音数据为第一用户的语音数据;
其中,所述声纹识别模型基于所述权利要求1至6中任一项所述的声纹识别模型训练方法训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司,未经马上消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011594311.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钛铝铬合金靶及其制备方法
- 下一篇:一种管式微滤膜测试装置