[发明专利]企业授信模型的构建方法、装置、设备及可读存储介质在审
| 申请号: | 202011573614.0 | 申请日: | 2020-12-25 |
| 公开(公告)号: | CN112529699A | 公开(公告)日: | 2021-03-19 |
| 发明(设计)人: | 朱晨鸣 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
| 主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q10/06;G06Q10/04;G06K9/62 |
| 代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 张志江 |
| 地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 企业 模型 构建 方法 装置 设备 可读 存储 介质 | ||
1.一种企业授信模型的构建方法,其特征在于,所述企业授信模型的构建方法包括以下步骤:
从企业主的个人信用报告中获取所述企业主的个人信用数据;
基于不同的分类变量组合对应的个人信用数据的统计变量,确定各个分类变量组合下的统计变量在不同统计维度下的特征统计,得到特征集合;
采用递归特征消除算法对所述特征集合进行特征筛选,得到目标特征子集;
将所述目标特征子集输入多个相对独立的回归树组,对所述回归树组进行训练,在训练完成时得到企业授信模型。
2.如权利要求1所述的企业授信模型的构建方法,其特征在于,所述基于不同的分类变量组合对应的个人信用数据的统计变量,确定各个分类变量组合下的统计变量在不同统计维度下的特征统计,得到特征集合的步骤之前,还包括:
确定所述个人信用数据的变量类型;
将所述变量类型为字符型或日期型的个人信用数据作为分类变量,以及将所述变量类型为数值型的个人信用数据作为所述个人信用数据的统计变量;
确定所述分类变量对应的分类变量组合,其中,所述分类变量组合为所述分类变量的任意组合。
3.如权利要求1所述的企业授信模型的构建方法,其特征在于,所述个人信用数据包括查询信息和信贷信息,所述统计维度包括计数、去重计数、求和、均值、中位数、缺失率、0值率、75%分位数或25分位数中的至少一种。
4.如权利要求1所述的企业授信模型的构建方法,其特征在于,所述采用递归特征消除算法对所述特征集合进行特征筛选,得到目标特征子集的步骤包括:
将预设回归模型作为所述递归特征消除算法的底层模型;
构建对应所述底层模型的目标代价函数;
根据所述目标代价函数以及所述底层模型从所述特征集合中迭代出所述目标特征子集。
5.如权利要求4所述的企业授信模型的构建方法,其特征在于,所述根据所述目标代价函数以及所述底层模型从所述特征集合中迭代出所述目标特征子集的步骤包括:
将所述特征集合输入至所述底层模型中,并基于所述目标代价函数,对所述底层模型进行迭代;
删除所述特征集合中权重低于预设权重阈值的特征,得到待定特征子集;
在每轮迭代结束时确定每轮迭代对应的模型性能,并且在达到最大迭代次数时确定最优的模型性能,以基于所述最优的模型性能将所述最优的模型性能对应的待定特征子集作为目标特征子集。
6.如权利要求5所述的企业授信模型的构建方法,其特征在于,所述将所述特征集合输入至所述底层模型中,并基于所述目标代价函数,对所述底层模型进行迭代的步骤包括:
将所述特征集合作为原始特征集合,并随机获取所述特征集合的特征子集;
根据所述特征子集以及所述目标代价函数,对所述底层模型进行训练;
判断所述底层模型在当次训练的误差是否小于前次训练的误差,是则保留所述特征子集中的特征,否则将所述特征子集中的特征从所述特征集合中删除,得到新的特征集合;
将所述新的特征集合作为所述特征集合,循环执行所述根据所述特征子集以及所述目标代价函数,对所述底层模型进行训练的步骤,直至满足训练停止条件。
7.如权利要求1至6任一项所述的企业授信模型的构建方法,其特征在于,所述将所述目标特征子集输入多个相对独立的回归树组,对所述回归树组进行训练,在训练完成时得到企业授信模型的步骤包括:
基于所述目标特征子集输入至多个相对独立的回归树组中进行多次迭代计算,计算相邻次迭代计算的残差;
根据残差对所述回归树组进行迭代,在迭代完成后得到企业授信模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011573614.0/1.html,转载请声明来源钻瓜专利网。





