[发明专利]一种风控模型的特征选择方法及装置在审
| 申请号: | 201910501554.2 | 申请日: | 2019-06-11 |
| 公开(公告)号: | CN110298390A | 公开(公告)日: | 2019-10-01 |
| 发明(设计)人: | 顾凌云;谢旻旗;段湾;王震宇;张涛;罗雨晨;张阳;乔韵如;黄海涛;冯杰;王存伟;周轩;潘峻 | 申请(专利权)人: | 上海冰鉴信息科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/06;G06Q40/00 |
| 代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 滕诣迪 |
| 地址: | 200120 上海市上海自*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供了一种风控模型的特征选择方法及装置,其中方法包括:将建模样本分为训练样本和测试样本;利用随机森林算法对训练样本进行训练获得初始模型AUC和KS以及特征重要度排序,利用二分法对已排序的特征进行初步筛选,将符合第一规则的特征作为第一备选特征集;对训练样本的特征进行聚类分析,将符合第二规则的特征作为第二备选特征集;从第一备选特征集和第二备选特征集的并集中多次选取预设比例的特征和样本组成新的备选样本分别进行逻辑回归建模,进行特征集选择得到新的特征集;对新的特征集进行全排列组合获取N个特征集,分别进行逻辑回归建模,获得N个训练模型;利用测试样本对N个训练模型分别进行测试,选择出最终模型。 | ||
| 搜索关键词: | 特征集 备选 训练样本 建模 测试样本 逻辑回归 特征选择 训练模型 风控 排序 样本 二分法 初步筛选 初始模型 聚类分析 随机森林 样本组成 最终模型 全排列 重要度 算法 预设 测试 | ||
【主权项】:
1.一种风控模型的特征选择方法,其特征在于,包括:获取建模样本,将所述建模样本分为训练样本和测试样本;利用随机森林算法对所述训练样本进行训练获得初始模型AUC和KS以及特征重要度排序,利用二分法对已排序的特征进行初步筛选,将符合第一规则的特征作为第一备选特征集;对所述训练样本的特征进行聚类分析,将符合第二规则的特征作为第二备选特征集;获取所述第一备选特征集和所述第二备选特征集的并集;从所述第一备选特征集和所述第二备选特征集的并集中多次选取预设比例的特征和样本组成新的备选样本,对所述新的备选样本分别进行逻辑回归建模,并使用stepwise进行双向选择挑选每个所述新的备选样本的特征集,对每个所述新的备选样本的特征集分别进行逻辑回归模型的交叉验证,计算每个所述新的备选样本的特征集的平均AUC和平均KS以及AUC标准差和KS标准差,按照预设特征集挑选标准进行特征集选择,得到新的特征集;对所述新的特征集进行全排列组合获取N个特征集,对所述N个特征集中的每个特征集分别进行逻辑回归建模,获得N个训练模型;利用所述测试样本对所述N个训练模型分别进行测试,得到每个所述训练模型对应的AUC和KS,根据每个所述训练模型对应的AUC和KS选择出最终模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海冰鉴信息科技有限公司,未经上海冰鉴信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910501554.2/,转载请声明来源钻瓜专利网。





