[发明专利]一种风险评估方法及装置在审
申请号: | 202010093501.4 | 申请日: | 2020-02-14 |
公开(公告)号: | CN111353689A | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 梅止观;贺欧文;李诗诗 | 申请(专利权)人: | 北京贝壳时代网络科技有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06K9/62;G06N20/00 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 马瑞 |
地址: | 100000 北京市密云*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 风险 评估 方法 装置 | ||
本发明实施例提供一种风险评估方法及装置,其中方法包括:获取待预测用户所对应的特征数据;将所述特征数据输入至评分卡模型中,得到所述评分卡模型输出的风险预测结果;其中,所述评分卡模型预先以样本用户所对应的样本特征数据为训练样本,以样本特征数据所对应的标签数据为目标值训练得到,且所述标签数据已预先通过预设切分点进行二分类切分。本发明实施例实现了通过评分卡模型对多种应用场景的预测。
技术领域
本发明涉及风险评估技术领域,尤其涉及一种风险评估方法及装置。
背景技术
评分卡是一种常见的机器学习模型,典型应用场景包括银行放贷和企业征信等,旨在根据个人的基本信息拟合信用状况进行分数计算。评分卡已经成为具有严密理论和方法体系的信用评价手段。但是,经典评分卡仅适用于小数据量,高覆盖率和高准确性的数据场景中,且只能适用二分类业务场景,而对于互联网海量,低覆盖和低质量的数据场景没有系统性的解决方案,例如在关键数据缺失率极高的数据场景中则不适用,且并不能适用多种业务场景。
发明内容
本发明实施例提供一种风险评估方法及装置,以解决现有技术中只能采用评分模型对二分类业务场景进行风险评估的问题。
本发明实施例提供一种风险评估方法,包括:
获取待预测用户所对应的特征数据;
将所述特征数据输入至评分卡模型中,得到所述评分卡模型输出的风险预测结果;
其中,所述评分卡模型预先以样本用户所对应的样本特征数据为训练样本,以样本特征数据所对应的标签数据为目标值训练得到,且所述标签数据已预先通过预设切分点进行二分类切分。
可选地,所述将所述特征数据输入至评分卡模型中,得到所述评分卡模型输出的预测结果之前,还包括:获取样本用户所对应的样本特征数据和真实风险值;当所述样本特征数据的缺失率大于预设缺失阈值时,通过与所述样本特征数据的数据类型相对应的机器学习模型对所述样本特征数据进行填充,得到填充后数据,所述填充后数据包括填充后特征数据和所述样本特征数据所对应的标签数据;通过所述填充后数据对预设二分类模型进行训练,得到训练后模型;通过所述样本特征数据和所述真实风险值对所述训练后模型进行准确度测试,并当所述训练后模型的准确度大于预设准确度阈值时,将所述训练后模型确定为所述评分卡模型。
可选地,所述通过与所述样本特征数据的数据类型相对应的机器学习模型对所述样本特征数据进行填充,得到填充后数据,包括:当所述样本特征数据的数据类型为连续型时,通过线性模型对所述样本特征数据进行填充,得到填充后数据;当所述样本特征数据的数据类型为二分类型时,通过逻辑回归模型对所述样本特征数据进行填充,得到填充后数据;当所述样本特征数据的数据类型为无序多分类型时,通过Softmax模型对所述样本特征数据进行填充,得到填充后数据;当所述样本特征数据的数据类型为有序多分类型时,通过有序多分类模型对所述样本特征数据进行填充,得到填充后数据。
可选地,所述通过与所述样本特征数据的数据类型相对应的机器学习模型对所述样本特征数据进行填充,得到填充后数据,包括:获取所述样本特征数据中缺失率由低到高的数据位置排列顺序;按照所述缺失率由低到高的数据位置排列顺序,依次对缺失数据进行填充,得到填充后数据。
可选地,所述通过所述填充后数据对预设二分类模型进行训练,得到训练后模型,包括:通过预设切分点对所述标签数据进行切分,并对分属于预设切分点两侧的标签数据分别进行二分类标记;通过所述填充后特征数据和进行二分类标记后的标签数据对所述预设二分类模型进行训练,得到训练后数据。
可选地,当所述标签数据的数据类型为连续型时,所述通过预设切分点对所述标签数据进行切分之前,还包括:通过反向映射,将所述标签数据转换为sigmoid曲线;根据所述sigmoid曲线,确定所述标签数据所对应的切分点,并将所确定的切分点确定为预设切分点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京贝壳时代网络科技有限公司,未经北京贝壳时代网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010093501.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理