[发明专利]一种合同违约风险预测模型的训练方法和相关装置在审
申请号: | 202211152021.6 | 申请日: | 2022-09-21 |
公开(公告)号: | CN115409127A | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 谢波;周成阳;蒋洪伟;严欢 | 申请(专利权)人: | 中国农业银行股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/06 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨傥月 |
地址: | 100005 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 合同 违约 风险 预测 模型 训练 方法 相关 装置 | ||
本申请公开了一种合同违约风险预测模型的训练方法和相关装置,获取训练集,该训练集包括至少一条有标签的第一样本数据和至少一条无标签的第二样本数据。基于第一样本数据,通过有监督学习的方式训练得到初始合同违约风险预测模型,并将第二样本数据输入至初始合同违约风险预测模型中,得到第二样本数据的伪标签,基于具有伪标签的第二样本数据和第一样本数据,通过半监督学习的方式训练得到合同违约风险预测模型,以便基于合同违约风险预测模型预测合同数据的违约风险。由此,通过给无标签的第二样本数据附上伪标签,从而避免了人工标记,不仅可以快速得到合同违约风险预测模型,还能够降低人工打标的成本。
技术领域
本发明涉及计算机技术领域,尤其是涉及一种合同违约风险预测模型的训练方法和相关装置。
背景技术
随着市场经济的发展,合同成为企业从事经济活动取得经济效益的重要纽带,而同时,合同违约现象也给企业带来了极大的经济损失。因此,识别合同风险是合同管理一项重要环节。
相关技术中,通过提取已经违约的合同的各个指标,通过提取出的指标不断训练得到合同违约风险预测模型,从而基于合同违约风险预测模型在签约合同前进行合同违约风险预测。
但是,在训练的过程中,需要对样本的标签进行分类,而通常已经标记的样本数量较少,而在短时间内难以完成所有样本的类别标记,进而无法快速得到合同违约风险预测模型,同时,样本的标记一般需要通过人工进行,成本较高。
发明内容
针对上述问题,本申请提供一种合同违约风险模型的训练方法和相关装置,用于提高合同违约风险预测模型的训练速度的同时,降低成本。
基于此,本申请实施例公开了如下技术方案:
一方面,本申请实施例提供一种合同违约风险预测模型的训练方法,所述方法包括:
获取训练集,所述训练集包括至少一条有标签的第一样本数据和至少一条无标签的第二样本数据,标签用于标识所述第一样本数据是否具有违约风险;
基于所述第一样本数据,通过有监督学习的方式训练得到初始合同违约风险预测模型;
将所述第二样本数据输入至所述初始合同违约风险预测模型中,得到所述第二样本数据的伪标签;
基于具有所述伪标签的第二样本数据和所述第一样本数据,通过半监督学习的方式训练得到合同违约风险预测模型,其中,在通过所述半监督学习的方式训练的过程中调整所述伪标签,所述合同违约风险预测模型用于预测合同数据的违约风险。
可选的,所述方法还包括:
获取具有违约风险的合同数据的多个合同要素,所述多个合同要素包括合同名称、合同文本、合同业务类型、发文文号、发文日期、制定机构、失效性和适用产品中的多种组合。
从所述多个合同要素中筛选出关键合同要素,所述关键合同要素与所述合同数据的违约率间的相关性超过预设阈值;
基于所述关键合同要素确定样本数据,所述样本数据包括第一样本数据和所述第二样本数据。
可选的,所述基于具有所述伪标签的第二样本数据和所述第一样本数据,通过半监督学习的方式训练得到合同违约风险预测模型,包括:
确定具有约束的损失函数,所述约束包括用于降低复杂度的第一约束、用于防止陷入局部最优的第二约束和用于成对约束监督的第三约束中的一个或多个组合;
基于具有所述伪标签的第二样本数据和所述第一样本数据,通过半监督学习的方式训练使得所述具有约束的损失损失函数最小,得到所述合同违约风险预测模型。
可选的,所述方法还包括:
获取测试集,所述测试集包括至少一条有标签的第三样本数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司,未经中国农业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211152021.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种锂铝硅偏振玻璃及其制备方法和应用
- 下一篇:一种电力电缆架空输送装置