[发明专利]基于集成学习的互联网金融风控预测方法在审
申请号: | 202210287645.2 | 申请日: | 2022-03-22 |
公开(公告)号: | CN114580782A | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 岳钧;李开恒;王正宁;周钊聿;周乐瑶 | 申请(专利权)人: | 四川省自然资源科学研究院(四川省生产力促进中心) |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q40/02;G06Q40/04;G06K9/62 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 许驰 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 集成 学习 互联网 金融 预测 方法 | ||
本发明公开了基于集成学习的互联网金融风控预测方法,涉及金融风控领域,包括S1构建预测模型;S2获取数据集,并进行数据处理;S3处理后的数据集导入预测模型对其进行优化训练,获得最优预测模型;S4待预测数据导入到最优预测模型获得风控预测结果;搭建一种经过优化的Bagging集成学习框架,该框架通过随机分配每个基础模型的训练数据进行训练,再通过每个基础模型的AUC为依据加权融合,得到最终的结果;并集合一种经过优化的Stacking集成学习框架,该框架分为两层,第一层模型为多个基础模型对初始数据集训练后进行预测,第一层模型的预测结果最为第二层模型的训练数据,第二层模型为单一模型将第一层模型的预测结果进行集成后输出最终结果。
技术领域
本发明涉及金融风控领域,尤其涉及一种基于集成学习的互联网金融风控 预测方法。
背景技术
通过对借贷用户在网购、交易、社交等多方平台的信誉及行为数据进行深 入挖掘和分析,对其在各个平台、场景下产生的数据进行归类、汇总,以大数 据时代为背景,以机器学习方法为手段建立用户违约预测模型,将用户的有效 信息转化为用户的违约概率,更好的把控用户和平台发生借贷交易的风险。
目前现有的解决方法,包括评分卡模型以及传统的LR、SVM和RF算法对 于违约用户的识别能力不强。
发明内容
本发明的目的就在于为了解决上述问题设计了一种基于集成学习的互联网 金融风控预测方法。
本发明通过以下技术方案来实现上述目的:
基于集成学习的互联网金融风控预测方法,包括:
S1、构建预测模型,预测模型包括第一层模型和第二层模型,第一层模型 包括至少两个基础模型,第二层模型包括一个基础模型,第一层模型的输出作 为第二层模型的输入;
S2、获取数据集,并对数据集进行数据处理;
S3、处理后的数据集导入预测模型对其进行优化训练,获得最优预测模型;
S4、待预测数据导入到最优预测模型获得风控预测结果。
本发明的有益效果在于:针对互联网金融风控场景搭建一种经过优化的 Bagging集成学习框架,该框架通过随机分配每个基础模型的训练数据进行训练, 再通过每个基础模型的AUC为依据加权融合,得到最终的结果;
针对互联网金融风控场景搭建一种经过优化的Stacking集成学习框架,该 框架分为两层,第一层模型为多个基础模型对初始数据集训练后进行预测,第 一层模型的预测结果最为第二层模型的训练数据,第二层模型为单一模型将第 一层模型的预测结果进行集成后输出最终结果。
附图说明
图1是本发明基于集成学习的互联网金融风控预测方法的流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明 实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然, 所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附 图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要 求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的 实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某 一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解 释。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川省自然资源科学研究院(四川省生产力促进中心),未经四川省自然资源科学研究院(四川省生产力促进中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210287645.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能纸巾机自适应网关
- 下一篇:一种园林绿化土方回填的施工方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理