[发明专利]一种信用评估方法在审
申请号: | 202111123065.1 | 申请日: | 2021-09-24 |
公开(公告)号: | CN113793212A | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 赵茜 | 申请(专利权)人: | 重庆富民银行股份有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 重庆强大凯创专利代理事务所(普通合伙) 50217 | 代理人: | 赵玉乾 |
地址: | 401121 重庆市渝*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信用 评估 方法 | ||
本发明涉及数据建模技术领域,具体涉及一种用客户授权后获取的银行卡交易数据,构建客户级消费、交易画像变量,预测客户信贷风险的一种信用评估方法。本发明信用评估方法,包括变量衍生,基于获取的银行卡交易流水数据,衍生交易偏好、交易活跃度、消费水平和风险交易的变量;变量筛选,根据变量的缺失值、缺失率和IV值对变量进行筛选;模型拟合,对任何一组超参数组合使用训练集进行模型训练得到一个模型,并在测试集中计算该模型的AUC值,以测试集中AUC值最高的模型的超参数作为超参数最终值,且以该模型使用的变量作为最终入模变量;将训练集和测试集合并,进行模型拟合,得到最终模型,并计算在最终模型上的AUC值。
技术领域
本发明涉及数据建模技术领域,具体为一种基于XGB算法模型的信用评估方法。
背景技术
数据库技术、数理统计技术、计算机技术的发展为评分模型的发展和应用提供了科技基础。以预测模型为核心的信用评分模型通过挖掘消费者的行为特征、资信能力等,运用数理统计技术,系统性地对客户未来的信用表现作出预测,以分数对客户按表现优劣进行排队,作为决策依据。预测模型在20世纪七八十年代开始被推广使用,至今仍是信贷管理中使用最广泛、发展最完善的技术。随着征信信息的日益完善,覆盖群体的扩大,以征信为核心的信用评分模型也在汽车信贷、个人信贷、个人信用卡、小微经营贷等领域广泛应用。但征信信息的核心主要是客户信用卡、贷款每月的借还款行为,以信贷行为为主,而未囊括其他与客户信贷表现可能有关的消费行为、支付行为等。
发明内容
本发明意在提供一种用客户授权后获取的银行卡交易数据,构建客户级消费、交易画像变量,预测客户信贷风险的一种信用评估方法。
本发明一种信用评估方法,包括以下内容,
数据获取,基于已查询授权的客户样本,获取各个客户的银行卡交易流水数据;
变量衍生,基于获取的银行卡交易流水数据,处理客户级的行为标签,衍生出交易偏好、交易活跃度、消费水平和风险交易的变量;
变量筛选,根据变量的缺失值、缺失率和IV值,对变量进行筛选;
模型拟合,将样本集分为训练集、测试集和跨时间验证集,在模型拟合中,采用网格搜索的方法选择最优的超参数组合,在进行网格搜索时,对任何一组超参数组合使用训练集进行模型训练得到一个模型,并在测试集中计算该模型的AUC值,以测试集中AUC值最高的模型的超参数作为超参数最终值,且以该模型使用的变量作为最终入模变量;将训练集和测试集合并形成合并集,在已确定超参数最终值和最终入模变量的基础上,进行模型拟合,得到最终模型,并计算在最终模型上的AUC值。
本发明的有益效果:在取得信贷客户授权后,获取客户名下所有银行卡的交易流水信息,加工客户级的行为标签,衍生出交易偏好、交易活跃度、消费水平、风险交易等类别的变量。匹配对应客户的信贷表现,用XGB算法建立客户违约概率预测模型。
进一步地,在变量筛选中,还包括采用XGB算法的嵌入式筛选对变量进行筛选,采用嵌入式筛选可以得到更有的筛选结果,嵌入式筛选分多个轮次进行,每个轮次进行如下操作:
将样本集随机划分为训练集和测试集;
选择XGB算法模型,XGB算法模型评估指标为AUC,设置XGB算法模型超参数;
采用训练集进行模型训练;
在测试集上评估XGB算法模型效果,计算AUC值,如果此轮的AUC值比上一轮有大幅下降,则终止筛选迭代,以上一轮筛选出的变量作为模型拟合的待选变量,否则继续进行变量筛选。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆富民银行股份有限公司,未经重庆富民银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111123065.1/2.html,转载请声明来源钻瓜专利网。