[发明专利]一种信用评估模型训练、评估方法与装置有效
申请号: | 201811500994.8 | 申请日: | 2018-12-10 |
公开(公告)号: | CN109767312B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 刘欣阳;周琪云;曲彦文;高子健 | 申请(专利权)人: | 江西师范大学 |
主分类号: | G06Q40/03 | 分类号: | G06Q40/03 |
代理公司: | 南昌市平凡知识产权代理事务所 36122 | 代理人: | 许艳 |
地址: | 330100 *** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信用 评估 模型 训练 方法 装置 | ||
本发明公开一种的信用评估模型训练、评估的方法与装置,其中信用评估模型通过训练方法得到,包括:获取已有正确信用评估结果的用户在征信系统中的用户数据以及评估结果;对收集到的用户数据中的用户数据进行预处理,转换为数值数据,包含但不限于将类别型数据进行One hot变换,数值型数据进行归一化;构建m个SDT子分类器,m为正整数,另构建一个SDT权重生成器,用以生成m个SDT子分类器的权重概率分布;利用预处理后的用户数据对具有m+1棵软决策树的WSDF模型进行端到端的训练。通过本发明所述方法构建的信用评估模型与装置,拥有更高的工作效率,而且可以降低坏账率;同时具有产生可视化的决策过程。
技术领域
本发明公开了一种金融风险评估领域中的信用评估模型训练、评估的方法与装置,具体涉及到基于加权软决策森林的信用评估模型训练、评估方法与装置。
背景技术
信用评估是金融机构预测客户是否违约的关键步骤。错误的信用评估会使金融机构蒙受经济损失。开发智能的信用评估系统不仅可以提高金融机构的工作效率,还可以降低坏账率。近年来,常用的传统征信系统中大多使用评分卡来构建用户的信用模型。评分卡主要使用逻辑回归算法来实现,可以提高线性模型的性能。
但是,目前常用的线性模型虽然能保证一定的可解释性,模型性能却并不能满足需求,导致这种方法对用户的信用评估预测结果可能不准确,实际应用价值有限。目前,已有许多人工智能算法被应用于该领域,如支持向量机、集成学习、K-最近邻等方法,大幅提高了信用评估模型的性能。然而,这些人工智能算法由于其计算过程的复杂性,普遍存在可解释性差的问题。而信用评估模型的可解释性又是具有现实意义的,例如:欧盟颁布的“通用数据保护条例”明确要求企业对智能算法得到的决策进行适当解释,否则会给予巨额罚款。
因此,如何在保证模型具有良好可解释性的前提下,提高信用评估的准确性,是本领域技术人员亟需解决的技术问题。
发明内容
本发明要解决的技术问题是提供一种性能良好同时具有一定可解释性的信用评估模型的训练、评估方法以及装置。
为此,本发明的第一个目的在于提出一种新型的基于加权软决策森林的信用评估模型及训练方法。该模型基于软决策树(SoftDecision Tree,SDT)实现,构建m个SDT子分类器进行分类,1个SDT权重生成器对m个SDT子分类器进行加权集成。由于SDT是一种逻辑上具有二叉树结构的深度神经网络,因而该模型在保证性能的同时,继承了决策树算法的可解释性。
本发明的第二个目的在于提出一种可解释的信用评估方法。
本发明的第三个目的在于提出一种可解释的信用评估模型的训练装置。
本发明的第四个目的在于提出一种可解释的信用评估装置。
为达到上述目的,本发明的技术方案是这样实现的:
一种信用评估模型的训练方法,其特征在于,它包括以下步骤:
S11,获取已有正确信用评估结果的用户在征信系统中的用户数据以及评估结果;
S12,对收集到的用户数据中的用户数据进行预处理,转换为数值数据;
S13,构建m个SDT子分类器,m为正整数,另构建一个SDT权重生成器,用以生成m个SDT子分类器的权重概率分布,该模型即为加权软决策森林(Weighted SoftDecisionForest,WSDF);
S14,利用预处理后的用户数据对具有m+1棵软决策树的WSDF模型进行端到端的训练。
进一步地,上述S13具体包括:
构建m个SDT子分类器和一个SDT权重生成器,并初始化模型参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西师范大学,未经江西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811500994.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:财务业务整合无人化算法
- 下一篇:基于资源配置的方法及相关产品