[发明专利]一种解决小微企业信贷授信风险控制和管理方法及装置有效
申请号: | 202111132730.3 | 申请日: | 2021-09-27 |
公开(公告)号: | CN113793214B | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 田羽;兰翔;陈刚;刘甜甜;汪大磊 | 申请(专利权)人: | 武汉众邦银行股份有限公司 |
主分类号: | G06Q40/03 | 分类号: | G06Q40/03;G06Q10/0639;G06F18/214;G06F16/242 |
代理公司: | 成都正煜知识产权代理事务所(普通合伙) 51312 | 代理人: | 李龙 |
地址: | 432200 湖北省武汉市黄陂区盘龙城经济开发区汉*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 解决 企业 信贷 风险 控制 管理 方法 装置 | ||
1.一种解决小微企业信贷授信风险控制和管理方法,其特征在于,包括以下步骤:
步骤1、获取小微企业信贷申请请求,形成信贷申请数据集Hive;
步骤2、请求征信机构数据,与信贷申请数据集进行交叉验证,并依据核验信息将客户分类,得到分类客户数据;
步骤3、抽取分类客户数据,提取客户申请特征信息后生成训练集和测试集的Hive;
步骤4、利用主动学习技术对步骤3所述训练集Hive进行信用评级,得到信用评级;
步骤5、得到步骤4所述信用评级后,通过不对称偏差分析方法对训练集Hive进行校验;
步骤6、综合步骤5中校验通过的小微企业信贷信用评级结果进行授信额度的发放;
所涉及步骤1中小微企业信贷申请数据集包括四部分:
第一部分是实名认证数据;
第二部分是个人资料数据;
第三部分是额度任务数据,包含企业基础资料、企业财税信息及其他证明材料数据;
第四部分是申请人在信贷申请各阶段中操作所记录的埋点数据;
所涉及步骤2中第三方机构提供的征信数据包括个人类及企业类,个人类包括人行征信、黑产、灰产数据,企业类包括企业基本信息、信贷信息、公共信息和声明信息,将信贷申请数据集与第三方机构提供的征信数据进行交叉验证,根据核验信息将客户分为三类,标记黑户、白户、灰户;
执行步骤3,提取分类客户信贷申请中特征信息前,需要对申请数据集包含的数据进行需要对数据集含的数据进行结构化与非结构化数据处理,具体操作内容包括:
步骤3.1、使用SQL查询语句获取所需的全部数据,并使用Python进行数据的加载;
步骤3.2、对数据进行EDA探索,包含变量的统计值分析,结合变量的业务特征对变量进行缺失值填充,删除重复数据;
步骤3.3、按灰户与白户3:7的比例提取数据并构造模型所需特征,包括对分类变量的数值化处理,和连续变量的离散化处理,以及通过变量交叉、合成衍生新的符合业务逻辑的变量;
步骤3.4、对数据进行无量纲化处理,可选方法包括有实际意义的量纲处理和数理化的量纲处理,处理完成后按8:2的比例划分为训练集和测试集得到Hive数据;
执行步骤4,提取训练集的Hive数据,利用主动学习技术进行训练,具体操作内容包括:
步骤4.1、提取步骤3.4处理完成后的训练集的Hive数据;
步骤4.2、采用批查询策略,挑选出需标注样本,并更改列特征标注样本状态,样本状态包括训练、测试、未打标、待标注,通过前端展示给专家进行标注;
步骤4.3、通过人工标注的专家经验或者业务经验的提炼获得候选集的标注数据,然后将标注结果回传至训练集的Hive数据中;
步骤4.4、利用评分卡模型来训练步骤4.3所述训练集的Hive数据,得到小微企业信贷信用评级;
执行步骤5,得到步骤4.4所述信用评级后,通过不对称偏差分析方法进行验证,依据验证结果并持续提升改进模型效果,具体操作内容包括:
步骤5.1、提取步骤4所述完成训练的小微企业信贷信用评级数据;
步骤5.2、通过不对称偏差分析方法对步骤4.3所述训练集Hive进行校验判别,与步骤5.1信用评级数据相互印证、相互补充、为信用评价结果提供充分和必要的依据;
步骤5.3、根据验证结果,若误差大于设置阈值,可选择进行增量学习或者重新学习的方式更新模型,从而将迭代数据融入主动学习模型中,达到提升模型效果。
2.一种解决小微企业信贷授信风险控制和管理装置,其特征在于,包括:
数据获取模块、获取小微企业信贷申请请求,形成信贷申请数据集Hive;
分类模块、请求征信机构数据,与信贷申请数据集进行交叉验证,并依据核验信息将客户分类,得到分类客户数据;
训练集和测试集模块、抽取分类客户数据,提取客户申请特征信息后生成训练集和测试集的Hive;
评级模块、利用主动学习技术对步骤3所述训练集Hive进行信用评级,得到信用评级;
校验模块、得到所述信用评级后,通过不对称偏差分析方法对训练集Hive进行校验;
授信模块、综合校验通过的小微企业信贷信用评级结果进行授信额度的发放;
所涉及步骤1中小微企业信贷申请数据集包括四部分:
第一部分是实名认证数据;
第二部分是个人资料数据;
第三部分是额度任务数据,包含企业基础资料、企业财税信息及其他证明材料数据;
第四部分是申请人在信贷申请各阶段中操作所记录的埋点数据;
第三方机构提供的征信数据包括个人类及企业类,个人类包括人行征信、黑产、灰产数据,企业类包括企业基本信息、信贷信息、公共信息和声明信息,将信贷申请数据集与第三方机构提供的征信数据进行交叉验证,根据核验信息将客户分为三类,标记黑户、白户、灰户;
提取分类客户信贷申请中特征信息前,需要对申请数据集包含的数据进行需要对数据集含的数据进行结构化与非结构化数据处理,具体操作内容包括:
步骤3.1、使用SQL查询语句获取所需的全部数据,并使用Python进行数据的加载;
步骤3.2、对数据进行EDA探索,包含变量的统计值分析,结合变量的业务特征对变量进行缺失值填充,删除重复数据;
步骤3.3、按灰户与白户3:7的比例提取数据并构造模型所需特征,包括对分类变量的数值化处理,和连续变量的离散化处理,以及通过变量交叉、合成衍生新的符合业务逻辑的变量;
步骤3.4、对数据进行无量纲化处理,可选方法包括有实际意义的量纲处理和数理化的量纲处理,处理完成后按8:2的比例划分为训练集和测试集得到Hive数据;
提取训练集的Hive数据,利用主动学习技术进行训练,具体操作内容包括:
步骤4.1、提取步骤3.4处理完成后的训练集的Hive数据;
步骤4.2、采用批查询策略,挑选出需标注样本,并更改列特征标注样本状态,样本状态包括训练、测试、未打标、待标注,通过前端展示给专家进行标注;
步骤4.3、通过人工标注的专家经验或者业务经验的提炼获得候选集的标注数据,然后将标注结果回传至训练集的Hive数据中;
步骤4.4、利用评分卡模型来训练步骤4.3所述训练集的Hive数据,得到小微企业信贷信用评级;
通过不对称偏差分析方法进行验证,依据验证结果并持续提升改进模型效果,具体操作内容包括:
步骤5.1、提取完成训练的小微企业信贷信用评级数据;
步骤5.2、通过不对称偏差分析方法对步骤4.3所述训练集Hive进行校验判别,与步骤5.1信用评级数据相互印证、相互补充、为信用评价结果提供充分和必要的依据;
步骤5.3、根据验证结果,若误差大于设置阈值,可选择进行增量学习或者重新学习的方式更新模型,从而将迭代数据融入主动学习模型中,达到提升模型效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉众邦银行股份有限公司,未经武汉众邦银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111132730.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双线性对计算加速系统及方法
- 下一篇:一种具有美妆储存空间的冰箱