[发明专利]模型、保险风控模型训练方法、装置及电子设备有效
申请号: | 202010010979.6 | 申请日: | 2020-01-06 |
公开(公告)号: | CN111242195B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 王修坤;张文博 | 申请(专利权)人: | 蚂蚁胜信(上海)信息技术有限公司 |
主分类号: | G06F18/2321 | 分类号: | G06F18/2321;G06F18/2433;G06F17/18 |
代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 王戈 |
地址: | 200010 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 保险 训练 方法 装置 电子设备 | ||
1.一种模型训练方法,包括:
获取待选数据样本,所述待选数据样本包含非异常数据和具有异常因子的异常数据;
对所述待选数据样本进行聚类,得到根据用户行为特征分组的数据组;
根据各所述数据组中所述异常数据的统计值判断所述数据组的样本属性,所述样本属性为白样本和黑样本中的一种;所述根据各所述数据组中所述异常数据的统计值判断所述数据组的样本属性包括:根据各所述数据组中异常数据的统计值,若异常数据的统计值较大,则将该数据组中所有数据均认定为黑样本;
利用得到的所述白样本和黑样本进行训练,得到业务模型。
2.如权利要求1所述的方法,获取待选数据样本,包括:
利用所述异常因子从数据库中提取所述异常数据;
利用非异常因子从数据库中提取所述非异常数据;
根据所述异常数据和所述非异常数据确定所述待选数据样本。
3.如权利要求1所述的方法,根据各所述数据组中所述异常数据的统计值判断所述数据组的样本属性,包括:
统计各所述数据组中的异常数据,得到各个所述数据组的所述统计值;
根据所述统计值与所述样本属性之间的对应关系,确定所述统计值所属的数据组的所述样本属性。
4.如权利要求1所述的方法,根据各所述数据组中所述异常数据的统计值判断所述数据组的样本属性,包括:
根据各所述数据组中所述异常数据的占比判断所述数据组的样本属性。
5.如权利要求4所述的方法,根据各所述数据组中异常数据的占比判断所述数据组的样本属性,包括:
若所述数据组中所述异常数据的占比超过阈值,则判定所述数据组的样本属性为所述黑样本。
6.如权利要求4所述的方法,根据各所述数据组中所述异常数据的占比判断所述数据组的样本属性,包括:
若所述数据组中各数据均为所述非异常数据,则判定所述数据组的样本属性为所述白样本。
7.如权利要求1所述的方法,还包括:
利用训练得到的所述业务模型对预测数据进行预测,得到预测结果;
获取待选数据样本,包括;
根据所述预测结果所属的预测数据更新所述待选数据样本。
8.一种保险风控模型训练方法,包括:
获取待选保险数据样本,所述待选保险数据样本包含非异常数据和具有异常因子的异常数据;
对所述待选保险数据样本进行聚类,得到根据用户行为特征分组的数据组;
根据各所述数据组中异常数据的统计值判断对应的所述数据组的样本属性,所述样本属性为白样本和黑样本中的一种;所述根据各所述数据组中所述异常数据的统计值判断所述数据组的样本属性包括:根据各所述数据组中异常数据的统计值,若异常数据的统计值较大,则将该数据组中所有数据均认定为黑样本;
利用得到的所述白样本和黑样本进行训练,得到保险风控模型。
9.一种模型训练装置,包括:
获取模块,获取待选数据样本,所述待选数据样本包含非异常数据和具有异常因子的异常数据;
聚类模块,对所述待选数据样本进行聚类,得到根据用户行为特征分组的数据组;
判断模块,根据各所述数据组中所述异常数据的统计值判断所述数据组的样本属性,所述样本属性为白样本和黑样本中的一种;所述根据各所述数据组中所述异常数据的统计值判断所述数据组的样本属性包括:根据各所述数据组中异常数据的统计值,若异常数据的统计值较大,则将该数据组中所有数据均认定为黑样本;
训练模块,利用得到的所述白样本和黑样本进行训练,得到业务模型。
10.如权利要求9所述的装置,获取待选数据样本,包括:
利用所述异常因子从数据库中提取所述异常数据;
利用非异常因子从数据库中提取所述非异常数据;
根据所述异常数据和所述非异常数据确定所述待选数据样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于蚂蚁胜信(上海)信息技术有限公司,未经蚂蚁胜信(上海)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010010979.6/1.html,转载请声明来源钻瓜专利网。