[发明专利]模型训练方法、装置及设备在审
| 申请号: | 202210043189.7 | 申请日: | 2022-01-14 |
| 公开(公告)号: | CN116486131A | 公开(公告)日: | 2023-07-25 |
| 发明(设计)人: | 吕永春;朱徽;周迅溢;曾定衡 | 申请(专利权)人: | 马上消费金融股份有限公司 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/74;G06V10/82;G06V10/774;G06N3/0464;G06N3/0895 |
| 代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 张敏 |
| 地址: | 401120 重庆市渝北区*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 装置 设备 | ||
1.一种模型训练方法,其特征在于,所述方法包括:
将多个第一样本分别输入至目标模型中,得到每个所述第一样本对应的第一预测类别标签,并基于每个所述第一样本对应的第一预测类别标签得到所述多个第一样本对应的预测标签集合,所述第一样本为不存在类别标签的样本;
基于多个第一增强样本,确定所述预测标签集合中不同的第一预测类别标签各自对应的基准特征,其中,所述第一增强样本为分别对所述多个第一样本和存在类别标签的多个第三样本进行第一数据增强处理而得到;
基于各第一预测类别标签对应的基准特征和与各所述第一预测类别标签对应的第一样本对应的特征,对所述多个第一样本对应的第一损失信息进行校准,得到校准后的第一损失信息;
基于校准后的第一损失信息和所述多个第三样本对应的第二损失信息对所述目标模型进行训练,得到训练后的目标模型。
2.根据权利要求1所述的方法,其特征在于,所述基于多个第一增强样本,确定所述预测标签集合中不同的第一预测类别标签各自对应的基准特征,包括:
针对所述预测标签集合中每一种第一预测类别标签,执行下述处理:
获取第一预测类别标签对应的多个第一增强样本,并确定获取的第一增强样本各自对应的特征,以及确定获取的第一增强样本的数量;
基于所述获取的第一增强样本各自对应的特征和所述获取的第一增强样本的数量,计算所述获取的第一增强样本各自对应的特征的平均特征,将所述平均特征确定为所述第一预测类别标签对应的基准特征。
3.根据权利要求2所述的方法,其特征在于,基于各第一预测类别标签对应的基准特征和与各所述第一预测类别标签对应的第一样本对应的特征,对所述多个第一样本对应的第一损失信息进行校准,得到校准后的第一损失信息,包括:
针对所述预测标签集合中每一种第一预测类别标签执行下述处理:
确定所述第一预测类别标签对应的所有第一样本与所述第一预测类别标签对应的所述基准特征之间的多个第一相似度;
基于所述多个第一相似度,确定所述第一预测类别标签对应的所述第一样本的权重;
基于所述第一预测类别标签对应的所述第一样本的权重对所述第一损失信息校准,得到校准后的第一损失信息。
4.根据权利要求3所述的方法,其特征在于,所述基于所述多个第一相似度,确定所述第一预测类别标签对应的所述第一样本的权重,包括:
获取目标超参数,所述目标超参数用于调整所述第一预测类别标签对应的所述第一样本的权重;
基于所述目标超参数和所述第一相似度,确定所述第一预测类别标签对应的所述第一样本的权重。
5.根据权利要求2所述的方法,其特征在于,所述基于各第一预测类别标签对应的基准特征和与各所述第一预测类别标签对应的第一样本对应的特征,对所述多个第一样本对应的第一损失信息进行校准,得到校准后的第一损失信息,包括:
针对所述预测标签集合中的每一种第一预测类别标签,执行下述处理:
对第一预测类别标签对应的所有第一样本进行第二数据增强处理,得到多个第二增强样本;
将所述第一预测类别标签的所有第一样本对应的第一增强样本和第二增强样本输入至所述目标模型中,得到所述第一增强样本属于不同类别标签的第一概率分布信息,以及所述第二增强样本属于不同类别标签的第二概率分布信息;
基于所述第一概率分布信息和所述第二概率分布信息,确定所述第一预测类别标签对应的所有第一样本对应的损失信息;
基于所述第一预测类别标签对应的所述第一样本的权重和所述第一预测类别标签对应的所有第一样本对应的损失信息,得到加权损失信息,将所述加权损失信息作为校准后的第一损失信息。
6.根据权利要求1所述的方法,其特征在于,所述将多个第一样本分别输入至目标模型中,得到每个所述第一样本对应的第一预测类别标签,包括:
将所述多个第一样本输入至所述目标模型中,通过所述目标模型确定所述多个第一样本属于不同类别标签的概率分布信息,并基于所述多个第一样本属于不同类别标签的概率分布信息,通过锐化算法或argmax函数生成每个所述第一样本对应的第一预测类别标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司,未经马上消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210043189.7/1.html,转载请声明来源钻瓜专利网。





