[发明专利]一种基于集成树特征提取和Logistic回归的个人信用风险评估方法在审
申请号: | 202010492038.0 | 申请日: | 2020-06-03 |
公开(公告)号: | CN111652710A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 刘佳明;刘佳佳;李想;范皓玥 | 申请(专利权)人: | 北京化工大学 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 安丽 |
地址: | 100029 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 集成 特征 提取 logistic 回归 个人 信用风险 评估 方法 | ||
1.一种基于集成树特征提取和Logistic回归的个人信用风险评估方法,其特征在于,所述方法包括以下步骤:
步骤1)数据收集,收集用户的历史信贷数据作为初始数据集,所述初始数据集包括若干样本标签不同的样本,所述样本标签标记为信用违约的样本为正样本,所述样本标签标记为信用未违约的样本为负样本,所述样本包含若干不同信贷相关的特征数据与对应的样本标签信息;
步骤2)数据预处理,对步骤1)所述初始数据集特征数据进行预处理,得到已预处理数据集,所述预处理包括缺失值处理、异常值处理与标准化处理;
步骤3)数据分层抽样划分:按照设定正样本与负样本抽样比率、以及设定训练集与测试集划分比率对数据集,对步骤2)所述已预处理数据集进行随机抽样划分,得到训练集与测试集;
步骤4)特征转换提取:使用步骤3)所述训练集,对若干集成树模型参数分别进行训练,分别得到若干已训练集成树模型,将所述训练集特征数据分别输入至若干已训练集成树模型中,并分别提取得到训练集特征转换后的特征数据;
步骤5)特征融合:将步骤4)中从所述若干已训练集成树模型中分别提取的所述训练集特征转换后的特征数据进行融合,得到训练集特征融合后的特征数据,进而得到特征融合后的训练集;
步骤6)模型评估:使用步骤5)所述特征融合后的训练集,对Logistic回归模型参数进行训练,得到已训练Logistic回归模型,将步骤3)所述测试集的特征数据所入至步骤4)所述若干已训练集成树模型中,并提取测试集特征转换后的特征数据,将训练集所述特征转换后的特征数据进行融合,得到测试集特征融合后的特征数据,进而得到特征融合后的测试集,将所述特征融合后的测试集输入所述已训练Logistic回归模型,所述已训练Logistic回归模型输出所述特征融合后的测试集中每个样本的预测样本标签为信用违约或信用违约,并与所述特征融合后的测试集中每个样本的真实样本标签相比较以完成模型评估,进而建立所述方法。
2.如权利要求1所述的一种基于集成树特征提取和Logistic回归的个人信用风险评估方法,其特征在于,所述步骤1)中,所述若干不同信贷相关的特征数据中的特征包括但不限于,借款人欠款的信用账户数量、过去两年的交易次数、借款人地址、借款人的年收入、贷款申请是个人申请还是多人联合申请、借款人各个账户活期存款余额、借款人信用卡开卡账户数量、借款人信用卡账户可用金额占最高信用额度的比重、借款人每月偿债金额占月收入的比重、联合借款人每月偿债金额占月收入的比重、借款人的工作年限、借款人的房屋所有情况、利率、上个月收到借款人的还款、借款人申请的贷款金额、借款人的账号、距离借款人最早开立的循环账户的月份、抵押账户的数量、当前使用的银行卡账户数、正常还款的银行卡账户数、银行卡账户总数、分期付款的账户数、开立的循环账户的数量、循环账户总数、余额大于0的循环账户的交易次数、已过期120天的账户数量、逾期30天的账户数、过去一年开立的账户数、开立的银行账户总数、剩余的未偿还本金占总金额的比重、借款人从未拖欠的交易占总交易数的比重、借款人银行卡可用信贷金额占信贷限额的比重、借款目标、借款人账户可周转资金的总额、借款人正在使用资金占可周转总金额的比重、借款期限、贷款理由总体描述、信用额度、现在总信用额度、不包括抵押贷款的信贷总额、借款人银行卡信用额度、借款人信用卡分期付款信用额度、借款人到期支付的利息、借款人到期支付的本金、借款人循环贷款占信贷限额的比重、借款人的收入来源是否确定、联合借款人收入来源是否确定、借款人地址邮编前三位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京化工大学,未经北京化工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010492038.0/1.html,转载请声明来源钻瓜专利网。