[发明专利]一种信贷风险评估方法、装置、介质及设备在审
申请号: | 202011193977.1 | 申请日: | 2020-10-30 |
公开(公告)号: | CN112308702A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 姚尧;俞晓臣 | 申请(专利权)人: | 北京云从科技有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06N3/08 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 李铁 |
地址: | 102300 北京市门头沟区石*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信贷风险 评估 方法 装置 介质 设备 | ||
1.一种信贷风险评估方法,其特征在于,包括:
根据业务对象的业务类型确定与业务类型相对应的原始属性数据;
采用基于决策树的集成学习分箱算法对所述原始属性数据进行分箱处理,得到分箱结果;
基于所述分箱结果,以对所述预测模型进行训练,得到风险评估模型;
基于所述风险评估模型对所述业务对象进行风险评估,得到风险等级。
2.根据权利要求1所述的信贷风险评估方法,其特征在于,在对原始属性数据进行分箱时,根据所述业务类型,确定所述决策树的最大深度限制。
3.根据权利要求1所述的信贷风险评估方法,其特征在于,在对原始属性数据进行分箱的过程中,通过特征处理算法对原始属性数据所对应的特征进行特征处理,所述特征处理算法包括以下至少之一:特征直方图、基于梯度的单边采样、互斥特征捆绑。
4.根据权利要求3所述的信贷风险评估方法,其特征在于,所述通过特征处理算法对原始属性数据所对应的特征进行特征处理,包括:
确定所述原始属性数据的数据量以及值;
根据所述数据量及值确定特征处理算法;若所述原始属性数据的数据量以及值均超过设定阈值,则采用特征直方图、基于梯度的单边采样、互斥特征捆绑对所述原始属性数据对应的特征进行特征处理;若所述原始属性数据的数据量以及值不超过设定阈值,则采用特征直方图以及基于梯度的单边采样对所述原始属性数据对应的特征进行特征处理。
5.根据权利要求1所述的信贷风险评估方法,其特征在于,在将所述分箱结果输入至预测模型前,还包括:
对所述分箱结果进行WOE编码,得到目标分箱;
将所述目标分箱输入至预测模型。
6.根据权利要求1所述的信贷风险评估方法,其特征在于,所述预测模型神网络模型、决策树模型或逻辑回归模型。
7.根据权利要求1所述的数据处理方法,其特征在于,还包括对所述原始属性数据进行预处理,包括:
对所述原始属性数据进行清洗;
对清洗后的原始属性数据进行缺失值填充。
8.一种信贷风险评估装置,其特征在于,包括:
原始属性数据获取模块,用于根据业务对象的业务类型确定与业务类型相对应的原始属性数据;
分箱模块,用于采用基于决策树的集成学习分箱算法对所述原始属性数据进行分箱处理,得到分箱结果;
训练模块,用于基于所述分箱结果,以对所述预测模型进行训练,得到风险评估模型;
评估模块,用于基于所述风险评估模型对所述业务对象进行风险评估,得到风险等级。
9.根据权利要求8所述的信贷风险评估装置,其特征在于,在对原始属性数据进行分箱时,根据所述业务类型,确定所述决策树的最大深度限制。
10.根据权利要求8所述的信贷风险评估装置,其特征在于,所述分箱模块通过特征处理算法对原始属性数据所对应的特征进行特征处理,所述特征处理算法包括以下至少之一:特征直方图、基于梯度的单边采样、互斥特征捆绑。
11.根据权利要求10所述的信贷风险评估装置,其特征在于,所述分箱模块包括:
数据量确定子模块,用于确定所述原始属性数据的数据量以及值;
特征处理子模块,用于根据所述数据量及值确定特征处理算法;
若所述原始属性数据的数据量以及值均超过设定阈值,则采用特征直方图、基于梯度的单边采样、互斥特征捆绑对所述原始属性数据对应的特征进行特征处理;若所述原始属性数据的数据量以及值不超过设定阈值,则采用特征直方图以及基于梯度的单边采样对所述原始属性数据对应的特征进行特征处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云从科技有限公司,未经北京云从科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011193977.1/1.html,转载请声明来源钻瓜专利网。