[发明专利]模型、保险风控模型训练方法、装置及电子设备有效
申请号: | 202010010979.6 | 申请日: | 2020-01-06 |
公开(公告)号: | CN111242195B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 王修坤;张文博 | 申请(专利权)人: | 蚂蚁胜信(上海)信息技术有限公司 |
主分类号: | G06F18/2321 | 分类号: | G06F18/2321;G06F18/2433;G06F17/18 |
代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 王戈 |
地址: | 200010 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 保险 训练 方法 装置 电子设备 | ||
本说明书实施例公开了一种模型、保险风控模型训练方法、装置及电子设备,其基本思想是,获取待选数据样本,待选数据样本包含非异常数据和异常数据,对所述待选数据样本进行聚类,得到根据用户行为特征分组的数据组,根据各所述数据组中异常数据的统计值判断数据组的样本属性,所述样本属性为白样本和黑样本中的一种。此时,利用得到的所述白样本和黑样本进行训练,得到业务模型。
技术领域
本说明书实施例涉及计算机技术领域,尤其涉及一种模型、保险风控模型训练方法、装置及电子设备。
背景技术
借助于计算机技术的发展,线上业务增长显著。对一些特定业务,可以利用业务模型进行处理,该处理可以是分类、预测、识别等,在此不受具体限定。
通常,在业务模型应用之前,选取数据样本进行训练,其目的在于确定业务模型中各特征参数的具体值。数据样本是影响业务模型精确度的一个关键因素,一般情况下,数据样本越丰富,则业务模型精确度越高。
发明内容
有鉴于此,本说明书实施例提供了一种提升模型精确度的模型、保险风控模型训练方法、装置及电子设备。
本说明书实施例采用下述技术方案:
本说明书实施例提供一种模型训练方法,包括:
获取待选数据样本,所述待选数据样本包含非异常数据和具有异常因子的异常数据;
对所述待选数据样本进行聚类,得到根据用户行为特征分组的数据组;
根据各所述数据组中所述异常数据的统计值判断所述数据组的样本属性,所述样本属性为白样本和黑样本中的一种;
利用得到的所述白样本和黑样本进行训练,得到业务模型。
本说明书实施例还提供一种保险风控模型训练方法,包括:
获取待选保险数据样本,所述待选保险数据样本包含非异常数据和具有异常因子的异常数据;
对所述待选保险数据样本进行聚类,得到根据用户行为特征分组的数据组;
根据各所述数据组中异常数据的统计值判断对应的所述数据组的样本属性,所述样本属性为白样本和黑样本中的一种;
利用得到的所述白样本和黑样本进行训练,得到保险风控模型。
本说明书实施例还提供一种模型训练装置,包括:
获取模块,获取待选数据样本,所述待选数据样本包含非异常数据和具有异常因子的异常数据;
聚类模块,对所述待选数据样本进行聚类,得到根据用户行为特征分组的数据组;
判断模块,根据各所述数据组中所述异常数据的统计值判断所述数据组的样本属性,所述样本属性为白样本和黑样本中的一种;
训练模块,利用得到的所述白样本和黑样本进行训练,得到业务模型。
本说明书实施例还提供一种保险风控模型训练装置,包括:
获取模块,获取待选保险数据样本,所述待选保险数据样本所述待选保险数据样本包含非异常数据和具有异常因子的异常数据;
聚类模块,对所述待选保险数据样本进行聚类,得到根据用户行为特征分组的数据组;
判断模块,根据各所述数据组中所述异常数据的统计值判断所述数据组的样本属性,所述样本属性为白样本和黑样本中的一种;
训练模块,利用得到的所述白样本和黑样本进行训练,得到保险风控模型。
本说明书实施例还提供一种电子设备,包括:
处理器;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于蚂蚁胜信(上海)信息技术有限公司,未经蚂蚁胜信(上海)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010010979.6/2.html,转载请声明来源钻瓜专利网。