[发明专利]一种基于CNN的人行征信数据风险预测方法及系统在审
| 申请号: | 202310015628.8 | 申请日: | 2023-01-04 |
| 公开(公告)号: | CN116228393A | 公开(公告)日: | 2023-06-06 |
| 发明(设计)人: | 游江珊;兰翔;钟磊;刘银龙 | 申请(专利权)人: | 武汉众邦银行股份有限公司 |
| 主分类号: | G06Q40/03 | 分类号: | G06Q40/03;G06Q10/04;G06N3/0464;G06N3/084 |
| 代理公司: | 成都正煜知识产权代理事务所(普通合伙) 51312 | 代理人: | 徐金琼 |
| 地址: | 432200 湖北省武汉市黄陂区盘龙城经济开发区汉*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 cnn 人行征信 数据 风险 预测 方法 系统 | ||
1.一种基于CNN的人行征信数据风险预测方法,其特征在于,包括如下步骤:
步骤1:获取用户的人行征信报告数据,并进行数据预处理,包括对异常值、缺失值信息处理,以及好坏样本的定义,其中,用户的人行征信报告数据包括行内授信、用信记录以及用户的银行流水中的信息;
步骤2:基于预处理后的数据进行用户特征矩阵构建,并基于用户特征矩阵构建模型输入矩阵;
步骤3:构建深度卷积神经网络,并基于模型输入矩阵进行训练;
步骤4:基于训练好的深度总卷积网络对待预测的用户的人行征信报告数据的模型输入矩阵进行预测,得到预测结果。
2.根据权利要求1所述的一种基于CNN的人行征信数据风险预测方法,其特征在于,所述步骤1的具体步骤为:
步骤1.1:获取用户的人行征信报告数据,用户的人行征信报告数据包括基础数据和分类数据,基础数据包括年龄、学历、教育背景、婚否和工作信息;
步骤1.2:根据分类数据,将各基础数据所对应的分类数据划分为一级分类、对应一级分类的二级分类和对应二级分类的特征字段,其中,一级分类包括账户类型、业务种类和账户状态,二级分类包括账户类型下的非循环贷账户、循环贷账户和贷记卡账户,业务种类下的住房商业贷款、住房公积金贷款和消费贷款,账户状态下的逾期账户、已结清和未结清,特征字段即行为数据包括原始变量和衍生变量,其中,原始变量是指用户的人行征信报告数据中提及的变量,包括每张信用卡每月消费记录、新开账户、车贷信息和房贷信息,衍生变量指基于原始变得计算得到的新变量,包括信用卡消费总额和账户总数;
步骤1.3:对划分后的人行征信报告数据进行异常值和缺失值信息处理;
步骤1.4:基于步骤1.3得到的结果,对用户的人行征信报告数据进行好坏样本定义,其中,好坏样本的定义y={0,1},三期内信用卡、信贷或贷款只要出现任一期超过30天即为坏样本,根据dpd30_mob3字段判断样本y的好坏,y=0表示好样本,y=1表示坏样本,其中,三期内是指首次放款起算的3个月内,一个月为一期,dpd30_mob3表示常用逾期风险指标,表示三期内的任一期中存在逾期天数超过30天。
3.根据权利要求2所述的一种基于CNN的人行征信数据风险预测方法,其特征在于,所述步骤2中构建的用户特征矩阵为:
模块输入矩阵为:
其中,xper为m*n用户特征矩阵,xmn表示用户第m个月在第n个特征上的表现,即值的大小,xperj表示第j个用户的用户特征矩阵,yj表示第j个用户是好样本还是坏样本,即表示第j个标签。
4.根据权利要求3所述的一种基于CNN的人行征信数据风险预测方法,其特征在于,所述步骤3中,构建的深度卷积神经网络至少包括依次相连接的5个模块,以及与最后个模块相连接的全链接层;
各模块依次包括卷积层、池化层和激活函数;
所述卷积层依次包括边缘填充方法和3*3卷积核,步长为1;
所述池化层为2*2的最大池化层;
所述激活函数为ReLU。
5.一种基于CNN的人行征信数据风险预测系统,其特征在于,包括:
预处理模块:获取用户的人行征信报告数据,并进行数据预处理,包括对异常值、缺失值信息处理,以及好坏样本的定义,其中,用户的人行征信报告数据包括行内授信、用信记录以及用户的银行流水中的信息;
矩阵构建模块:基于预处理后的数据进行用户特征矩阵构建,并基于用户特征矩阵构建模型输入矩阵;
训练模块:构建深度卷积神经网络,并基于模型输入矩阵进行训练;
预测模块:基于训练好的深度总卷积网络对待预测的用户的人行征信报告数据的模型输入矩阵进行预测,得到预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉众邦银行股份有限公司,未经武汉众邦银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310015628.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





