[发明专利]一种贷款授信额度确定的方法、及其电子设备和存储介质在审
申请号: | 202111488387.6 | 申请日: | 2021-12-07 |
公开(公告)号: | CN114140230A | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 江远强 | 申请(专利权)人: | 百维金科(上海)信息科技有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q10/04 |
代理公司: | 上海中外企专利代理事务所(特殊普通合伙) 31387 | 代理人: | 孙益青 |
地址: | 200433 上海市杨*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 贷款 额度 确定 方法 及其 电子设备 存储 介质 | ||
1.一种贷款授信额度确定的方法,其特征在于:包括:
步骤S1:获取与待授信用户相关的原始数据,并通过Oracle数据库,按照用户的年龄、性别、职业和贷款记录的类别,对所述原始数据进行分类,并标记类别标签;
步骤S2:从所述原始数据中通过特征学习提取多个衍生特征;
步骤S3:对所述原始数据和所述多个衍生特征进行数据预处理;
步骤S4:构建XGBoost树集成预测模型;
步骤S5:优化XGBoost树集成预测模型的超参数;
步骤S6:确定目标客户的授信额度区间,以确定客户的最终权重,并给出客户的最终额度;以及
步骤S7:对验证用户进行授信额度预测。
2.根据权利要求1所述的贷款授信额度确定的方法,其特征在于,在步骤S1中的所述原始数据包括用户的属性数据、行为数据和信用数据,且所述原始数据来自于外部数据和/或内部数据。
3.根据权利要求1所述的贷款授信额度确定的方法,其特征在于,在步骤S2中的所述衍生特征是指对已授信用户的相关数据进行特征学习得到的具有业务含义的特征,且所述特征学习包括a)数据的统计聚合;b)根据时间序列衍生、特征交叉以及透传获得多个衍生特征;以及c)根据信用卡贷款数据,结合时间特征性,构造出近1年申请信用卡数和贷款笔数。
4.根据权利要求1所述的贷款授信额度确定的方法,其特征在于,在步骤S3中的所述预处理包括数据异常值的处理、缺失值的处理、对数变换、离散型变量的编码和连续型变量的分箱。
5.根据权利要求1所述的贷款授信额度确定的方法,其特征在于,步骤S4包括:
步骤S4.1:通过公式(1)对所述训练集中的训练样本建立目标函数,所述目标函数由损失函数和正则化项构成,
公式(1):其中,Obj表示第t次迭代的目标函数、n表示样品总数、l表示损失函数、y^i(t-1)表示第t-1次的预测值、ft(xi)是第t次对样本打分的分值、Ω(fi)表示正则化项;
步骤S4.2:使用泰勒多项式通过公式(2)简化公式(1),得到步骤S4.1中的所述目标函数的近似目标函数,
公式(2):其中,gi是一阶导数、hi是二阶导数、gi和hi分别表示第i个样本下损失函数的一阶偏导数与二阶偏导数,
步骤S4.3:得到XGBoost树集成预测模型的计算公式(3),
首先,定义Ij={i|q(xi)=j}为XGBoost树集成预测模型中叶子j的样本集合,然后,将其代入公式(2)中,在去掉常数项后,得到XGBoost树集成预测模型的计算公式(3):其中,Obj(t)是wj的一元二次方程、T和w分别表示第k棵回归树的叶子数量和叶子权重、γ和λ分别表示是叶子数量T和权重w的惩罚系数、gi和hi分别表示l的一阶导数和二阶导数、Ij为每个叶子节点上的样本集合、wj2为每个叶子节点分数的L2模平方;以及
步骤S4.4:通过公式(4)和公式(5)求得叶子j的最优权重以及目标函数的最优值,
公式(4)公式(5)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百维金科(上海)信息科技有限公司,未经百维金科(上海)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111488387.6/1.html,转载请声明来源钻瓜专利网。