[发明专利]一种基于多视角不完整数据的信贷违约预测方法及系统有效
申请号: | 201810997190.7 | 申请日: | 2018-08-29 |
公开(公告)号: | CN109242671B | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 王琰;童华;苏辉东 | 申请(专利权)人: | 厦门市七星通联科技有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06F17/18 |
代理公司: | 厦门智慧呈睿知识产权代理事务所(普通合伙) 35222 | 代理人: | 杨玉芳 |
地址: | 361000 福建省厦门*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视角 完整 数据 信贷 违约 预测 方法 系统 | ||
本发明公开了一种基于多视角不完整数据的信贷违约预测方法,包括:S1、对收集的信贷信息样本中缺失的属性数据进行填充,获得完整的输入矩阵;S2、基于完整的输入矩阵构建多视角融合的第一目标函数,并最小化第一目标函数,获得最优的属性视角隶属度矩阵;S3、构建预测过程中的第二目标函数,并最小化第二目标函数,获得最优的视角权重向量;S4、输入待预测的用户信贷信息,并基于最优的属性视角隶属度矩阵和视角权重向量,对用户信贷违约概率进行预测。相应的,本发明还公开了一种基于多视角不完整数据的信贷违约预测系统。采用本发明实施例,能够更好地融合缺失视角的不完整数据,提高预测准确率。
技术领域
本发明涉及信息技术领域,尤其涉及一种基于多视角不完整数据的信贷违约预测方法及系统。
背景技术
随着互联网的发展,互联网技术的发展对金融领域造成的冲击将越来越大,金融的轻应用、碎片化属性将越发明显,从传统借贷到P2P平台、再从小额借贷平台,无不体现了一个趋势,占中国企业总数97%以上的小微企业的借贷需求正在逐步被发现,而且越来越受到重视。小微企业固定资产规模小、资产结构中可抵押物比例小、抗风险能力弱、业务不稳定等特点,使其很难申请到抵押贷款和信用贷款。为开发这个新兴市场,人们提出根据客户行为轨迹预测其未来的还贷能力,降低信贷客户违约的风险。例如,可以通过第三方渠道获取用户的历史贷款信息、是否进入银行黑名单、是否有信息不匹配、是否电信欠费、是否属于法院被执行人、以及每家快递公司所体现的该客户接收快递次数等数据,这相当于从不同每个视角探看用户行为,从而能更精准地判断用户的履约可能。然而,这些第三方渠道的数据收集源,都只能得到少量信息,因此数据集会有大量的缺失值。因此,这就衍生出一个挑战,即基于缺失视角的数据预测。
这是一个多视角的数据融合问题,传统的方法多视角融合一般用于图像处理技术,要求先有小部分完整数据作为训练,然后根据训练出的模型,对缺失视角的数据进行处理,得出补全后的数据。但是,在基于客户行为轨迹的小额信贷审批场景下,通常通过各种渠道收集了很多视角的信息。然而,收集到的用户行为轨迹多是不完整的,即使单个视角数据,也无法找到一份完整的数据样本。因此,首要的任务是对缺失数据进行填补。传统的缺失数据补全方法,或是基于整个属性的统计值(如均值)为所在属性的缺失数据赋值,或是基于相似样本在该属性上的统计值进行赋值。只是,前者过于简略,会降低后续步骤的预测准确性,而后者则不可行,因为样本集中缺失数据过多,甚至无法找到一对可计算相似度的样本。因此,传统的信贷违约预测准确率低下。
发明内容
本发明实施例提出一种基于多视角不完整数据的信贷违约预测方法及系统,能够更好地融合缺失视角的不完整数据,提高预测准确率。
本发明实施例提供一种基于多视角不完整数据的信贷违约预测方法,包括:
S1、收集信贷信息样本,并对收集的信贷信息样本中缺失的属性数据进行填充,获得完整的输入矩阵;
S2、基于所述完整的输入矩阵构建多视角融合的第一目标函数,并最小化所述第一目标函数,获得最优的属性视角隶属度矩阵;
S3、基于所述完整的输入矩阵和所述最优的属性视角隶属度矩阵构建预测过程中的第二目标函数,并最小化所述第二目标函数,获得最优的视角权重向量;
S4、输入待预测的用户信贷信息,并基于所述最优的属性视角隶属度矩阵和所述最优的视角权重向量,对用户信贷违约概率进行预测。
进一步地,所述信贷信息样本包括信贷用户填写的个人信息以及贷款审核方从第三方渠道取得的用户信用信息和用户行为轨迹信息;
所述输入矩阵为X,其中NS是样本数量,DS是属性数。
进一步地,所述S1具体包括:
收集信贷信息样本,并根据所述信贷信息样本构建输入矩阵X;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市七星通联科技有限公司,未经厦门市七星通联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810997190.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于大数据的违约概率预测方法
- 下一篇:鹰眼反欺诈大数据风控评估系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置