[发明专利]一种信贷风险评估方法、装置、介质及设备在审
申请号: | 202011193977.1 | 申请日: | 2020-10-30 |
公开(公告)号: | CN112308702A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 姚尧;俞晓臣 | 申请(专利权)人: | 北京云从科技有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06N3/08 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 李铁 |
地址: | 102300 北京市门头沟区石*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信贷风险 评估 方法 装置 介质 设备 | ||
本发明公开了一种信贷风险评估方法,包括:根据业务对象的业务类型确定与业务类型相对应的原始属性数据;采用基于决策树的集成学习分箱算法对所述原始属性数据进行分箱处理,得到分箱结果;基于所述分箱结果,以对所述预测模型进行训练,得到风险评估模型;基于所述风险评估模型对所述业务对象进行风险评估,得到风险等级。本发明基于决策树的集成学习分箱算法对所述原始属性数据进行分箱,可以根据数据的特点自动进行多轮的迭代拟合,每一轮迭代都会针对上一轮迭代中的不足,进行针对性的增强,从而达到更好的分箱效果。
技术领域
本发明涉及金融领域,具体涉及一种信贷风险评估方法、装置、介质及设备。
背景技术
因为金融风控行业的特殊性,对于算法模型的可解释性以及可靠性要求较高,容错性很低,所以评分卡模型被大家广泛使用。在传统的评分卡模型中,连续变量离散化是必不可少的一步,此环节中卡方分箱的应用最为广泛。但卡方分箱也有其缺点,首先卡方分箱对于数据分布有先验假设(假设数据符合卡方分布)以及要进行置信度水平的设定,是在此前提之下进行的统计学计算,没有考虑到样本自身的特点;其次卡方分箱在理论频数小于5时,需要进行连续性矫正,性能会收到一定的影响。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种信贷风险评估方法、装置、机器可读介质及设备,用于解决现有技术存在的问题。
为实现上述目的及其他相关目的,本发明提供一种信贷风险评估方法,包括:
根据业务对象的业务类型确定与业务类型相对应的原始属性数据;
采用基于决策树的集成学习分箱算法对所述原始属性数据进行分箱处理,得到分箱结果;
基于所述分箱结果,以对所述预测模型进行训练,得到风险评估模型;
基于所述风险评估模型对所述业务对象进行风险评估,得到风险等级。
可选地,在对原始属性数据进行分箱时,根据所述业务类型,确定所述决策树的最大深度限制。
可选地,在对原始属性数据进行分箱的过程中,通过特征处理算法对原始属性数据所对应的特征进行特征处理,所述特征处理算法包括以下至少之一:特征直方图、基于梯度的单边采样、互斥特征捆绑。
可选地,所述通过特征处理算法对原始属性数据所对应的特征进行特征处理,包括:
确定所述原始属性数据的数据量以及值;
根据所述数据量及值确定特征处理算法;若所述原始属性数据的数据量以及值均超过设定阈值,则采用特征直方图、基于梯度的单边采样、互斥特征捆绑对所述原始属性数据对应的特征进行特征处理;若所述原始属性数据的数据量以及值不超过设定阈值,则采用特征直方图以及基于梯度的单边采样对所述原始属性数据对应的特征进行特征处理。
可选地,在将所述分箱结果输入至预测模型前,还包括:对所述分箱结果进行WOE编码,得到目标分箱;
将所述目标分箱输入至预测模型。
可选地,所述预测模型神网络模型、决策树模型或逻辑回归模型。
可选地,还包括对所述原始属性数据进行预处理,包括:
对所述原始属性数据进行清洗;
对清洗后的原始属性数据进行缺失值填充。
为实现上述目的及其他相关目的,本发明提供一种信贷风险评估装置,包括:
原始属性数据获取模块,用于根据业务对象的业务类型确定与业务类型相对应的原始属性数据;
分箱模块,用于采用基于决策树的集成学习分箱算法对所述原始属性数据进行分箱处理,得到分箱结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云从科技有限公司,未经北京云从科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011193977.1/2.html,转载请声明来源钻瓜专利网。