[发明专利]多维数据下的网贷借款人信用评价方法在审
申请号: | 201810704228.7 | 申请日: | 2018-06-25 |
公开(公告)号: | CN109325844A | 公开(公告)日: | 2019-02-12 |
发明(设计)人: | 梁雪春;王名豪 | 申请(专利权)人: | 南京工业大学 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 211816 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于大数据的P2P借款人信用评价方法。本发明包括数据采集模块,数据处理模块,模型构建模块。在大数据时代,信用数据源不断扩大,主要包括以下四个方面:金融机构产生的信用数据,相关政府部门产生的信用数据,其它公共事业机构产生的信用数据,网络产生的互联网信用数据。数据模块主要分为两部分,将金融机构、相关政府部门、公共事业机构所产生的信用数据定性为结构化数据采集;互联网信用数据中的微信朋友圈和新浪微博等社交媒体数据作为非结构化数据采集。数据处理模块主要针对结构化数据,包括数据平衡化处理、特征选择。针对个人信用结构化数据存在不平衡现象,本发明使用CART‑SMOTE算法进行数据平衡化处理;大数据背景下个人信用评估数据特征繁杂,无关和冗余的变量会对模型预测的准确性造成不利的影响,本发明综合使用随机森林和梯度下降决策树进行评价特征的选择。结构化数据模型使用改进的lightGBM进行信用初步评级;对非结构化的社交文本数据进行特征抽取,使用深度学习进行信用评价及情感倾向分析。再将个人社交媒体文本数据中所展现的情感倾向反馈到P2P借款人的信用评估中,研究两者相关性。为最终的信用评价结构提供参考。 | ||
搜索关键词: | 信用数据 信用评价 结构化数据 大数据 公共事业机构 数据处理模块 个人信用 金融机构 情感倾向 数据平衡 政府部门 结构化数据模型 非结构化数据 模型构建模块 数据采集模块 采集 多维数据 非结构化 媒体数据 媒体文本 模型预测 评估数据 数据模块 随机森林 特征抽取 特征选择 文本数据 信用评估 互联网 决策树 冗余 算法 微博 评级 定性 反馈 参考 信用 改进 网络 分析 学习 研究 | ||
【主权项】:
1.一种P2P信用评估方法,其特征在于,所述方法包括:S101:P2P借款人数据采集,数据包含四方数据。金融机构产生的信用数据,相关政府部门产生的信用数据,其它公共事业机构产生的信用数据,网络产生的互联网信用数据。其中金融机构、相关政府部门、公共事业机构所产生的信用数据定性为结构化数据采集;互联网信用数据中的微信朋友圈和新浪微博等社交媒体数据作为非结构化数据采集。S102:采集数据处理,结构化数据中数据处理包含缺失值异常值处理、特征选择、数据平衡化。非结构化数据处理包含相关性社交文本选择、特征抽取。S103:基于混沌粒子群算法对lightGBM的训练参数进行优化,并将改进的lightGBM模型用于结构化数据的个人信用初步评级。S104构建深度学习模型对非结构化数据中的社交文本进行情感偏向分析,并将社交文本情感倾向与个人信用相关性进行分析。S105根据社交文本情感倾向与个人信用相关性,决定非结构化数据在个人信用评估中的决策权重,综合结构化数据模型和非结构化数据模型进行个人信用评估。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工业大学,未经南京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810704228.7/,转载请声明来源钻瓜专利网。