[发明专利]一种面向大规模非平衡征信数据的个人信用风险评估方法及评估系统在审
申请号: | 201810393852.X | 申请日: | 2018-04-27 |
公开(公告)号: | CN108550077A | 公开(公告)日: | 2018-09-18 |
发明(设计)人: | 徐达宇;魏致善;蓝倩;施宇伦;林路 | 申请(专利权)人: | 信雅达系统工程股份有限公司;浙江农林大学 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310051 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 风险评估 个人信用 非平衡 构建 样本 评估系统 维度 约简 特征选择算法 训练样本集 弹性网络 加权矩阵 历史数据 模型实施 评估结果 数据展现 衰减函数 相关参数 训练矩阵 质心距离 可信度 隶属度 数据集 指数化 自适应 高维 类簇 | ||
本发明公开一种面向大规模非平衡征信数据的个人信用风险评估方法及评估系统,该方法包括:首先,根据获取的高维大规模非平衡历史征信数据,构建由所获取的历史数据集构建的训练矩阵X,利用自适应弹性网络特征选择算法对给定的历史征信数据集实施维度约简;然后将经过维度约简后的训练样本集划分为少数样本类及多数样本类,根据类簇质心距离指数化衰减函数计算每个样本的隶属度,构建加权矩阵W,设置相关参数,用IWELM模型实施个人信用风险评估。本发明所提的方法克服大规模征信数据展现出的高度非平衡性问题,同时提升个人信用风险评估的执行速度与效率,增强评估结果的可靠性和可信度。
技术领域
本发明涉及数据评估领域,尤其涉及一种面向大规模非平衡征信数据的个人信用风险评估方法及评估系统。
背景技术
目前,面向多渠道、碎片化、异构、半结构化和非结构化征信数据的个人信用风险评估方法越来越受到金融服务机构的重视。由于当前采集的信用风险评估数据所展现出的大规模、高维、稀疏以及高度类不平衡等特点,要求在进行评估模型训练前对数据进行相应的属性约简,以提升原数据集的质量与信息密度,从而帮助建立更为有效地个人信用风险评估模型,在此过程中需要采用相应的特征选择算法对粗糙的原数据集进行降维,剔除与评估目标无关及弱相关的变量。在个人信用风险评估领域常用的特征选择方法主要有原始Lasso,以及对原始Lasso的改进算法,如group Lasso、adaptive Lasso及fused Lasso等。
而在个人信用风险评估模型方面,主要分为统计模型与非统计模型两大类,统计类模型典型代表有Logistic回归模型、Probit模型及K-近邻判别模型等;非统计类模型主要包括贝叶斯网络、决策树模型和粗糙集,以及大量的人工智能算法,如神经网络、支持向量机和各类深度学习算法。而人工智能算法在解决大数据信用风险评估问题时更具有优势,更适用于处理具有大量输入变量的稀疏数据,能更好地解决模型过度拟合问题,预测准确度较高,因此人工智能算法越来越受到该研究领域相关学者的重视。
然而,在大规模征信数据特征选择方面,虽然基于Lasso及其改进形式的特征选择算法在实践中被证明是有效的,但依然存在一些缺陷。即Lasso利用L1范数的正则化最小二乘方法进行特征筛选,在样本的特征维数远远大于样本总数时,Lasso的效果不很令人满意,不管所选出的特征数量是否达到饱和,Lasso都最多只能选择样本数量的特征维数,且对于两两之间具有强相关性的一组特征,Lasso倾向于随意地选择其中某一个而忽略该组中所有的其他特征。
并且,在个人信用评估模型方面,现有的评估方法更重视评估精度指标,极少考虑当前大规模征信数据中普遍存在的类不平衡现象,即违约行为大大少于履约,但少量的违约信息中往往隐藏着重要的具有反欺诈价值的信息,传统评估模型的训练目标是追求经验风险或者结构风险最小,经验风险最小是期望求得最低的训练集的误分率,这会使得属于少数类的实例被大量误分,结构风险最小其实是期望求得类间距离最大化,这通常会使得类间隔面被移动到实例分布比较稀疏的类别那一边,从而使得分类器对少数类失灵。且传统算法对大规模数据集的分类效率偏低,构建类间隔面的时间开销也很高。
发明内容
本发明的目的在于针对当前征信数据展现出的大规模、高维、稀疏及高度类不平衡等问题,提供一种面向大规模非平衡征信数据的个人信用风险评估方法及其系统,具体技术方案如下:
一种面向大规模非平衡征信数据的个人信用风险评估方法,其特征在于,该方法包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于信雅达系统工程股份有限公司;浙江农林大学,未经信雅达系统工程股份有限公司;浙江农林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810393852.X/2.html,转载请声明来源钻瓜专利网。