[发明专利]基于集成学习的互联网金融风控预测方法在审
申请号: | 202210287645.2 | 申请日: | 2022-03-22 |
公开(公告)号: | CN114580782A | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 岳钧;李开恒;王正宁;周钊聿;周乐瑶 | 申请(专利权)人: | 四川省自然资源科学研究院(四川省生产力促进中心) |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q40/02;G06Q40/04;G06K9/62 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 许驰 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 集成 学习 互联网 金融 预测 方法 | ||
1.基于集成学习的互联网金融风控预测方法,其特征在于,包括:
S1、构建预测模型,预测模型包括第一层模型和第二层模型,第一层模型包括k个基础模型,第二层模型包括一个基础模型,第一层模型的输出作为第二层模型的输入;
S2、获取数据集,并对数据集进行数据处理;
S3、处理后的数据集导入预测模型对其进行优化训练,获得最优预测模型;
S4、待预测数据导入到最优预测模型获得风控预测结果。
2.根据权利要求1所述的基于集成学习的互联网金融风控预测方法,其特征在于,在S1中,k不小于2,第一层模型的基础模型各不相同。
3.根据权利要求1所述的基于集成学习的互联网金融风控预测方法,其特征在于,在S2中进行数据处理包括:
S21、采用特殊空字符串处理、常量列清理、重复列清理、非法值替换和异常值清理对数据集进行分析处理;
S22、将分析处理后的数据集分为连续性数据和离散性数据;
S23、对离散性数据进行独热编码(one-hot),对连续性数据进行归一化处理,形成处理后的数据集D;
S24、将数据集D划分为多份数据,数据的数量等于第一层模型中基础模型的数量k。
4.根据权利要求3所述的基于集成学习的互联网金融风控预测方法,其特征在于,在S3中包括:
S31、处理后的数据集导入第一层模型,获得第一层模型中每个基础模型的预测结果的集合表示为
S32、根据第一层模型中每个基础模的预测结果的集合确定第一层模型的第一预测结果;
S33、计算第一层模型的误差,基础模型的损失函数为其中pi为基础模型对第i条数据的预测结果,yi为第i条数据的真实标签值,并以AUC(Area under the Curve of ROC)作为模型性能的衡量指标优化第一层模型的基础模型;
S34、第一预测结果导入第二层模型进行训练优化,获得最优预测模型。
5.根据权利要求4所述的基于集成学习的互联网金融风控预测方法,其特征在于,在S31中,将数据集D中的一份数据作为第一层模型的验证数据,其余的k-1份数据作为第一层模型的训练数据,对第一层模型共计完成k次训练,并获得第一层模型中每个基础模型的预测结果的集合表示为其中fi为第一层模型中第i个基础模型,每个基础模型经过所有训练数据完成训练得到的预测结果集合记为其中为第k份训练数据下的预测结果集合,AUC集合为Γi={αi1,αi2,αi3,...αik)其中αik为第k份训练数据的AUC。
6.根据权利要求4所述的基于集成学习的互联网金融风控预测方法,其特征在于,在S32中,将每个基础模型fi训练的预测结果进行集成得到第一层模型的第一预测结果表示为其αi表示基础模型AUC的值,第一层模型完成训练得到的第一预测结果集Dnew,表示为
7.根据权利要求4所述的基于集成学习的互联网金融风控预测方法,其特征在于,在S33中,每个基础模型的误差为∈i,服从零均值方差为协方差的多维正态分布,所有基础模型的平均预测所得误差为最终的平方误差的期望为
8.根据权利要求6所述的基于集成学习的互联网金融风控预测方法,其特征在于,在S34中,第一预测结果集Dnew作为第二层模型fi的训练数据进行训练,训练后输出最终结果Ys=fi(Dnew)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川省自然资源科学研究院(四川省生产力促进中心),未经四川省自然资源科学研究院(四川省生产力促进中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210287645.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能纸巾机自适应网关
- 下一篇:一种园林绿化土方回填的施工方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理