[发明专利]一种风控模型的特征选择方法及装置在审
| 申请号: | 201910501554.2 | 申请日: | 2019-06-11 |
| 公开(公告)号: | CN110298390A | 公开(公告)日: | 2019-10-01 |
| 发明(设计)人: | 顾凌云;谢旻旗;段湾;王震宇;张涛;罗雨晨;张阳;乔韵如;黄海涛;冯杰;王存伟;周轩;潘峻 | 申请(专利权)人: | 上海冰鉴信息科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/06;G06Q40/00 |
| 代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 滕诣迪 |
| 地址: | 200120 上海市上海自*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 特征集 备选 训练样本 建模 测试样本 逻辑回归 特征选择 训练模型 风控 排序 样本 二分法 初步筛选 初始模型 聚类分析 随机森林 样本组成 最终模型 全排列 重要度 算法 预设 测试 | ||
本发明提供了一种风控模型的特征选择方法及装置,其中方法包括:将建模样本分为训练样本和测试样本;利用随机森林算法对训练样本进行训练获得初始模型AUC和KS以及特征重要度排序,利用二分法对已排序的特征进行初步筛选,将符合第一规则的特征作为第一备选特征集;对训练样本的特征进行聚类分析,将符合第二规则的特征作为第二备选特征集;从第一备选特征集和第二备选特征集的并集中多次选取预设比例的特征和样本组成新的备选样本分别进行逻辑回归建模,进行特征集选择得到新的特征集;对新的特征集进行全排列组合获取N个特征集,分别进行逻辑回归建模,获得N个训练模型;利用测试样本对N个训练模型分别进行测试,选择出最终模型。
技术领域
本发明涉及特征选择技术领域,尤其涉及一种风控模型的特征选择方法及装置。
背景技术
在风控建模方面,现在大多数金融机构依然采用较为传统的特征筛选方法(即专家经验),在特征维度特别大的情况下,单凭专家经验挑选特征,存在一定的弊端,容易遗漏重要特征,特征挖掘不够深入,很难筛选出最能刻画风险点的特征。
因此,设计一种风控模型的特征选择方法及装置成为亟待解决的问题。
发明内容
本发明旨在提供一种克服上述问题之一或者至少部分地解决上述任一问题的一种风控模型的特征选择方法及装置。
为达到上述目的,本发明的技术方案具体是这样实现的:
本发明的一个方面提供了一种风控模型的特征选择方法,包括:获取建模样本,将建模样本分为训练样本和测试样本;利用随机森林算法对训练样本进行训练获得初始模型AUC和KS以及特征重要度排序,利用二分法对已排序的特征进行初步筛选,将符合第一规则的特征作为第一备选特征集;对训练样本的特征进行聚类分析,将符合第二规则的特征作为第二备选特征集;获取第一备选特征集和第二备选特征集的并集;从第一备选特征集和第二备选特征集的并集中多次选取预设比例的特征和样本组成新的备选样本,对新的备选样本分别进行逻辑回归建模,并使用stepwise进行双向选择挑选每个新的备选样本的特征集,对每个新的备选样本的特征集分别进行逻辑回归模型的交叉验证,计算每个新的备选样本的特征集的平均AUC和平均KS以及AUC标准差和KS标准差,按照预设特征集挑选标准进行特征集选择,得到新的特征集;对新的特征集进行全排列组合获取N个特征集,对N个特征集中的每个特征集分别进行逻辑回归建模,获得N个训练模型;利用测试样本对N个训练模型分别进行测试,得到每个训练模型对应的AUC和KS,根据每个训练模型对应的AUC和KS选择出最终模型。
其中,利用二分法对已排序的特征进行初步筛选,将符合第一规则的特征作为第一备选特征集包括:先选前一半的变量用随机森林算法建模获得AUC和KS,再跟初始模型的AUC和KS进行比较,下降量大于阈值时,增加特征;下降量小于等于阈值时,减少特征;直到确定最佳位置获得第一备选特征集。
其中,对训练样本的特征进行聚类分析,将符合第二规则的特征作为第二备选特征集包括:对训练样本的特征进行聚类分析,计算训练样本的IV值,选出me类中IV值最高的前M个特征作为第二备选特征集,其中,M为预设个数。
其中,预设特征集挑选标准包括满足以下条件至少之一的一个或多个特征集的并集或交集:最大平均AUC;最大平均KS;和AUC和KS组成的综合指标(d*AUC+a*KS-b*AUC_sd-c*KS_sd);其中:a,b,c,d分别为预设值。
其中,交叉验证包括:5折交叉。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海冰鉴信息科技有限公司,未经上海冰鉴信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910501554.2/2.html,转载请声明来源钻瓜专利网。





