[发明专利]风险业务检测模型训练方法、风险业务检测方法及装置在审
申请号: | 202110587815.4 | 申请日: | 2021-05-27 |
公开(公告)号: | CN113112352A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 周煊烨;武梦杰;薛宗义 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吴梦圆 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 风险 业务 检测 模型 训练 方法 装置 | ||
1.一种风险业务检测模型的训练方法,包括:
获取训练样本数据集,其中,所述训练样本数据集包括历史风险业务的特征数据;
对所述训练样本数据集中历史风险业务的特征数据进行特征分析,得到特征分析结果;
确定与所述特征分析结果相匹配的多个候选风险业务检测模型;以及
利用所述训练样本数据集分别训练每个所述候选风险业务检测模型,以便从训练完成的多个所述候选风险业务检测模型中确定风险业务检测模型。
2.根据权利要求1所述的方法,其中,所述历史风险业务包括贷款业务;
所述特征数据包括贷款人性别、贷款金额、逾期次数、贷款人月收入、贷款人分期情况、贷款人征信情况中的一种或多种。
3.根据权利要求1所述的方法,其中,所述利用所述训练样本数据集分别训练所述多个候选风险业务检测模型,以便确定风险业务检测模型包括:
利用所述训练样本数据集训练所述多个候选风险业务检测模型,分别生成多个调参风险业务检测模型,其中,所述多个调参风险业务检测模型中的每个调参风险业务检测模型均包括与其对应的验证结果,所述验证结果表征所述调参风险业务检测模型的检测准确度;
根据所述验证结果,从所述多个调参风险业务检测模型中确定多个待测试风险业务检测模型,其中,所述待测试风险业务检测模型的数量小于等于所述调参风险业务检测模型的数量;
对所述多个待测试风险业务检测模型进行生产测试,以便从所述多个待测试风险业务检测模型中确定风险业务检测模型。
4.根据权利要求3所述的方法,其中,所述利用所述训练样本数据集训练所述多个候选风险业务检测模型,分别生成多个调参风险业务检测模型包括:
将所述训练样本数据集划分为训练集和调参集;
利用所述训练集训练所述多个候选风险业务检测模型,分别生成多个待调参风险业务检测模型;
利用所述调参集对所述多个待调参风险业务检测模型进行参数调整,分别生成多个调参风险业务检测模型。
5.根据权利要求3所述的方法,其中,所述对所述多个待测试风险业务检测模型进行生产测试,以便从所述多个待测试风险业务检测模型中确定风险业务检测模型包括:
获取生产测试数据集;
将所述生产测试数据集输入所述多个待测试风险业务检测模型,分别输出生产测试结果;
根据所述生产测试数据集,得到标准生产测试结果;
将所述多个待测试风险业务检测模型中,生产测试结果与所述标准生产测试结果相匹配的待测试风险业务检测模型确定为所述风险业务检测模型。
6.根据权利要求3所述的方法,其中,所述候选风险业务检测模型包括基于随机森林算法的候选风险业务检测模型;
所述利用所述训练样本数据集训练所述多个候选风险业务检测模型,分别生成多个调参风险业务检测模型包括:
将所述训练样本数据集划分为训练集和调参集;
根据所述训练集训练出随机森林,其中,所述随机森林中的决策树是根据所述训练集中的特征数据构建得到的;
利用所述调参集对所述随机森林进行调参,生成调参随机森林,其中,所述随机森林中的每棵决策树分别输出调参结果;
通过投票方式确定多个调参结果中出现次数最多的调参结果,作为所述验证结果。
7.根据权利要求1所述的方法,其中,所述候选风险业务检测模型包括基于随机森林算法的候选风险业务检测模型、基于朴素贝叶斯算法的候选风险业务检测模型、基于梯度提升决策树算法的候选风险业务检测模型中的任意之一。
8.一种风险业务检测方法,包括:
获取待测风险业务数据集;
将所述待测风险业务数据集输入至所述风险业务检测模型,输出检测结果,其中,所述风险业务检测模型由权利要求1至7任一项所述的风险业务检测模型的训练方法训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110587815.4/1.html,转载请声明来源钻瓜专利网。