[发明专利]一种P2P网贷借款人信用风险评估的装置在审
申请号: | 201710361864.X | 申请日: | 2017-05-19 |
公开(公告)号: | CN107194803A | 公开(公告)日: | 2017-09-22 |
发明(设计)人: | 梁雪春;潘登;夏美娟 | 申请(专利权)人: | 南京工业大学 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02 |
代理公司: | 南京钟山专利代理有限公司32252 | 代理人: | 戴朝荣 |
地址: | 210003 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 p2p 借款人 信用风险 评估 装置 | ||
1.一种P2P网贷借款人信用风险评估的装置,其特征在于,所述装置包括:
数据采集模块,用于采集评估P2P网贷借款人信用风险的原始数据;
指标体系构建模块,用于建立P2P网贷借款人信用风险评估指标体系;
数据处理模块,用于结合构建的P2P网贷借款人信用风险评估指标体系,将采集到的原始数据进行缺失值处理、离群值处理和数据归一化处理;
评估模型构建模块,用于通过机器学习算法构建P2P网贷借款人信用风险评估模型;
评估模型应用模块,用于利用构建的P2P网贷借款人信用风险评估模型对P2P网贷借款人信用风险进行量化以及评估。
2.根据权利要求1所述的装置,其特征在于,所述数据处理模块用于对原始数据进行数据泛化、缺失值处理、标准化处理、离群值处理和分层抽样处理。
3.根据权利要求2所述的装置,其特征在于,所述数据处理模块包括:
数据泛化单元,用于将数据集从第一概念层抽象到第二概念层,在抽象过程中包括数据字符转换和数据离散化的操作;其中,数据离散化包括把连续型数据切分为若干段,以区分自变量和目标变量。
4.根据权利要求2所述的装置,其特征在于,所述数据处理模块包括:
缺失值处理单元,用于删除缺失值,其中,所述缺失值的样本比例低于指定阈值并且所述缺失值在样本中随机出现;通过变量间关系预测缺失数据,并利用蒙特卡罗随机模拟方法生成多个完整数据集,再对各个所述完整数据集分别进行分析,并对分析结果进行汇总处理。
5.根据权利要求2所述的装置,其特征在于,所述数据处理模块包括:
标准化处理单元,用于将数据按比例缩放,使其固定在一个特定区域并对数据标准化;其中,所述标准化包括将数据映射至起始值和终止值分别为0和1的区间中或者利用对数运算对所述数据进行处理。
6.根据权利要求2所述的装置,其特征在于,所述数据处理模块包括:
离群值处理单元,用于通过箱式图来对数据点进行判断,当数据点与箱体下四分位数或上四分位数之间的距离超出距离阈值时,或者当数据点超过箱体图最大值时,将该数据点确定为离群值。
7.根据权利要求2所述的装置,其特征在于,所述数据处理模块包括:
分层抽样单元,用于在建立借款人信用风险评估模型之前,从数据集中分别抽取出训练集与测试集,其中,所述训练集用于构造模型,所述测试集用于评价模型。
8.根据权利要求1所述的装置,其特征在于,所述评估模型构建模块包括:
寻优模型构建单元,用于利用混沌布谷鸟算法CCS对Xgboost算法进行参数寻优,以构建CCS-Xgboost模型;
模型训练单元,用于通过历史交易数据对所述CCS-Xgboost模型进行训练,并把训练后的CCS-Xgboost模型作为P2P网贷借款人信用风险的评估模型。
9.根据权利要求8所述的装置,其特征在于,所述评估模型应用模块包括:
数据输入单元,用于用于把新数据输入到经过训练的CCS-Xgboost模型中,以输出P2P网贷借款人信用风险预测评估结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工业大学,未经南京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710361864.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:热板焊接用的活动式下固定板
- 下一篇:一种汽车白车身焊装旋转吊具