[发明专利]一种面向大规模非平衡征信数据的个人信用风险评估方法及评估系统在审
申请号: | 201810393852.X | 申请日: | 2018-04-27 |
公开(公告)号: | CN108550077A | 公开(公告)日: | 2018-09-18 |
发明(设计)人: | 徐达宇;魏致善;蓝倩;施宇伦;林路 | 申请(专利权)人: | 信雅达系统工程股份有限公司;浙江农林大学 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310051 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种面向大规模非平衡征信数据的个人信用风险评估方法及评估系统,该方法包括:首先,根据获取的高维大规模非平衡历史征信数据,构建由所获取的历史数据集构建的训练矩阵X,利用自适应弹性网络特征选择算法对给定的历史征信数据集实施维度约简;然后将经过维度约简后的训练样本集划分为少数样本类及多数样本类,根据类簇质心距离指数化衰减函数计算每个样本的隶属度,构建加权矩阵W,设置相关参数,用IWELM模型实施个人信用风险评估。本发明所提的方法克服大规模征信数据展现出的高度非平衡性问题,同时提升个人信用风险评估的执行速度与效率,增强评估结果的可靠性和可信度。 | ||
搜索关键词: | 风险评估 个人信用 非平衡 构建 样本 评估系统 维度 约简 特征选择算法 训练样本集 弹性网络 加权矩阵 历史数据 模型实施 评估结果 数据展现 衰减函数 相关参数 训练矩阵 质心距离 可信度 隶属度 数据集 指数化 自适应 高维 类簇 | ||
【主权项】:
1.一种面向大规模非平衡征信数据的个人信用风险评估方法,其特征在于,该方法包括如下步骤:步骤一:获取搜集的原始大规模个人信用记录数据集,构建模型训练的样本数据矩阵X和对应于样本数据的类别标签向量Y,其中,X=[x1,x2,…,xp]∈Rn×p为一组包含p个特征、n个样本的个人历史征信记录数据所构成的矩阵,其中xi=[x1i,x2i,…,xpi]T∈Rp(i=1,2,…,p)为表示样本的第i条个人信用记录;Y=[y1,y2,…,yn]T∈Rn×1表示对应于样本数据的类别标签向量,yj=1表示履约,记为“好客户”,yj=0表示违约,记为“坏客户”。步骤二:根据自适应弹性网络模型AEnet对样本数据矩阵X进行维度约简,所述的自适应弹性网络模型AEnet为在弹性网络模型的基础上,在L1范数惩罚项中加入权重系数
来实现变量的自动删选,该模型的准则定义如下式所示:
其中,
为β的L2范数惩罚项,
为β的L1范数惩罚项,而βi是基于矩阵X与Y的最小二乘估计值,λ1和λ2为两个非负的惩罚参数,且![]()
![]()
![]()
其中,γ和λ1*为正常数。步骤三:将经过AEnet模型维度约简后的训练样本集X*划分为少数样本类及多数样本类,利用类簇质心距离指数化衰减函数计算每个样本的隶属度,构建加权矩阵W,W为一个对角阵,对角线上的元素Wii即第i个样本的隶属度;设在训练集X*上的整体类不平衡比率的倒数为δ,即少数类与多数类样本数之比为δ,则两类样本的隶属度为:![]()
为第i个多数类客户信用记录样本
所对应的隶属函数值,
为第i个少数类客户信用记录样本
所对应的隶属函数值;
为评估函数,用于评估特定样本点
在特征空间所处位置的重要程度,且考虑样本总体在特征空间的具体分布信息,建立基于类簇质心距离指数化衰减的隶属度确定函数,如下式所示:![]()
![]()
为多数类或方差少数类所在簇类质心,
为
到其所在簇类质心的欧氏距离,σ2为X*的总体方差。步骤四:计算隐藏层输出矩阵H:
ai和bi分别表示第i个隐藏层节点的权重与偏置,G表示激活函数。步骤五:计算输出权重矩阵θ的近似解![]()
其中,
为隐层输出矩阵H的Moore‑Penrose广义逆;Y*为维度约简后的类别标签向量,且
步骤六:根据改进加权ELM模型IWELM计算第i个样例
在隐藏层上的输出向量
其中所述的IWELM的形式如下所示:
εi表示第i个训练样本的实际输出与期望输出之差;C为惩罚因子,用于调控网络的泛化能力与精确度间的平衡关系,s为删选后的样本数量。步骤七:根据改进加权ELM模型IWELM得到![]()
其中,I为单位矩阵,T为训练集X*对应的期望输出向量,将守约客户所对应类别输出节点的期望输出值设为1,违约客户所对应类别节点的输出值则设为0,K为标签类别数目。步骤八:通过下式可确定该客户所对应的类别标签,从而完成个人信用风险评估;![]()
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于信雅达系统工程股份有限公司;浙江农林大学,未经信雅达系统工程股份有限公司;浙江农林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810393852.X/,转载请声明来源钻瓜专利网。