[发明专利]一种基于集成算法的公积金个人贷款逾期预测方法在审
申请号: | 202310029342.5 | 申请日: | 2023-01-09 |
公开(公告)号: | CN116308732A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 赵作铭;洪晓霞;莫怀统;陈雪;王涓涓;刘娟;胡烨;杨世利;郭静;宋阳;黄黎;鄢萌 | 申请(专利权)人: | 赵作铭;洪晓霞;莫怀统;陈雪;王涓涓 |
主分类号: | G06Q40/03 | 分类号: | G06Q40/03;G06F18/2431;G06F18/214;G06F18/15;G06F18/211;G06F18/2433;G06F18/27 |
代理公司: | 重庆晟轩知识产权代理事务所(普通合伙) 50238 | 代理人: | 王海凤 |
地址: | 401121 重庆市*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 集成 算法 公积金 个人 贷款 逾期 预测 方法 | ||
1.一种基于集成算法的公积金个人贷款逾期预测方法,其特征在于,包括如下步骤:
构建个人贷款逾期预测模型,所述个人贷款逾期预测模型包括两个组件,其中组件一用于数据处理,组件二用于计算逾期预测分数;
所述组件一进行数据处理的步骤如下:
S101:获取公积金借款人特征矩阵Wuser、贷款数据Luser和逾期标签Oact。公积金借款人特征矩阵Wuser由多个公积金借款人user和与user对应的公积金借款人特征向量Vuser构成,贷款数据Luser由与user对应的公积金贷款数据特征Lfeature和user对应的实际逾期Overdueact构成。
S102:使用四分位点内距方法解决数据离群点问题,得到新的公积金借款人特征数据Wuser′和新的贷款数据Luser′。
S103:使用Spearman秩相关系数剔除高相关性特征的偏差对个人贷款逾期预测模型判断带来的影响,得到更新后的公积金借款人特征数据Wuser″和更新后的贷款数据Luser″。
S104:使用多共线性组件利用方差扩大因子方法缓和数据之间的多重共线性并优化S103中所得Wuser″和Luser″,得到对应的优化后的公积金借款人特征数据Wuser″′和优化后的贷款数据Luser″′;
S105:使用特征选择组件通过计算特征的信息价值更新优化S103中所得Wuser″′和Luser″′,得到对应的再次优化后的公积金借款人特征数据Wuser″″和再次优化后的贷款数据Luser″″;
所述组件二计算逾期预测分数的步骤如下:
S106:将组件一得到的Wuser″″和Luser″″使用NearMiss欠采样技术解决数据类别不平衡问题,对应的处理后的公积金借款人特征数据Wuserf、处理后的贷款数据Luserf和实际逾期标签Oactf。
S107:使用Wuserf,Luserf和Oactf训练随机森林组件得到最优随机森林组件;
S108:将待测公积金借款人特征矩阵Wtest和与Wtest对应的贷款数据Ltest输入S107得到的最优随机森林组件中,输出的是由逾期预测分数组成的m×1的矩阵Ttest,其中m是待测公积金借款人的数量,范围在0~1之间,当时,归类为0,表示该对应的待测公积金借款人没有逾期,当时,归类为1,表示该对应的待测公积金借款人逾期。
2.如权利要求1所述的基于集成算法的公积金个人贷款逾期预测方法,其特征在于,所述S101中Wuser、Luser和Overdueact具体做如下定义
定义其中,m表示公积金借款人总数,x…z表示该公积金借款人的所有特征。公积金借款人特征矩阵中的连续型特征m表示公积金借款人总数,xcon…zcon表示该公积金借款人的连续型特征。
定义其中,m表示公积金借款人总数也即贷款记录数,l1…ln表示该公积金借款人从公积金贷款的所有特征,公积金借款人贷款矩阵中的连续型特征l1con…lncon表示该公积金借款人从公积金贷款的连续型特征。
对于公积金借款人实际逾期标签Overdueact,当Overdueact=0时,表示该公积金借款人没有逾期,当Overdueact=1时,表示该公积金借款人逾期。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赵作铭;洪晓霞;莫怀统;陈雪;王涓涓,未经赵作铭;洪晓霞;莫怀统;陈雪;王涓涓许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310029342.5/1.html,转载请声明来源钻瓜专利网。