[发明专利]一种信用评估方法及系统、存储介质及终端设备在审
申请号: | 201710651715.7 | 申请日: | 2017-08-02 |
公开(公告)号: | CN107481132A | 公开(公告)日: | 2017-12-15 |
发明(设计)人: | 张鹏;何同国;曾毅 | 申请(专利权)人: | 上海前隆信息科技有限公司;福州云众数据科技有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06F17/27 |
代理公司: | 上海光华专利事务所(普通合伙)31219 | 代理人: | 徐秋平 |
地址: | 200080 上海市虹口*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信用 评估 方法 系统 存储 介质 终端设备 | ||
技术领域
本发明涉及信息处理的技术领域,特别是涉及一种信用评估方法及系统、存储介质及终端设备。
背景技术
信用评估是指信使用专家判断或数学分析方法,对个人和企业履约各种承诺能力和信誉程度进行全面评价,并用简单明了的符号或文字表达出来,以满足社会需要的市场行为。
在金融领域,尤其是信贷审核时需要对客户进行信用评估,以判断其是否具有履行信贷约定的能力和信誉程度,从而将客户标识为优质客户(信用较好)或劣质客户(信用较差)。
现有技术中主要采用一定的评分模型来判断客户的信用优劣。具体地,基于客户针对评分模型的得分来判断其信用的优劣,进而确定是否批准其信贷请求。然而,这种方式受限于评分模型,不能全面反映客户的信用状态,无法满足各种特点的客户的信用评估需求,导致信用评估结果不够精准。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种信用评估方法及系统、存储介质及终端设备,基于信贷审核中所获取的非结构化文本信息中所提取的特征词构建信用评估模型,并根据该信用评估模型实现待评估客户的信用评估。
为实现上述目的及其他相关目的,本发明提供一种信用评估方法,包括以下步骤:对信贷审核中所获取的文本信息进行分类,得到各个类别的文本信息;针对每个类别的文本信息进行文本分词,以获得该类别的特征词;基于各个类别的特征词建立信用评估模型;根据待评估客户的文本信息和所述信用评估模型,得到待评估客户的信用评估结果。
于本发明一实施例中,所述文本信息包括保险银行支付类、贷款理财信用类、生活消费类和其他类。
于本发明一实施例中,针对每个类别的文本信息进行文本分词,以获得该类别的特征词包括以下步骤:
采用停用词库和金融行业自定义词库,基于分词技术每个类别的文本信息进行分词;
计算出每个类别所获取的分词的TF-IDF词频,选取TF-IDF词频由高到低的第一预设数量的分词;
基于TF-IDF词频由高到低的第一预设数量的分词,计算每个分词的信息增益,选取信息增益由高到低的第二预设数量的分词;所述第二预设数量小于所述第一预设数量;
对所述第二预设数量的分词进行筛选、优化、组合,获取该类别的特征词。
于本发明一实施例中,基于各个类别的特征词建立信用评估模型包括以下步骤:
获取各个类别的特征词的0/1变量和TF-IDF词频;当文本信息中包含某一特征词时,该特征词的0/1变量为1;当文本信息中不包含某一特征词时,该特征词的0/1变量为0;
基于特征词的0/1变量和TF-IDF词频,采用二分类Logistic回归算法构建信用评估模型。
相应地,本发明还提供一种信用评估系统,包括分类模块、特征词获取模块、模型建立模块和评估模块;
所述分类模块用于对信贷审核中所获取的文本信息进行分类,得到各个类别的文本信息;
所述特征词获取模块用于针对每个类别的文本信息进行文本分词,以获得该类别的特征词;
所述模型建立模块用于基于各个类别的特征词建立信用评估模型;
所述评估模块用于根据待评估客户的文本信息和所述信用评估模型,得到待评估客户的信用评估结果。
于本发明一实施例中,所述文本信息包括保险银行支付类、贷款理财信用类、生活消费类和其他类。
于本发明一实施例中,所述特征词获取模块执行以下操作:
采用停用词库和金融行业自定义词库,基于分词技术每个类别的文本信息进行分词;
计算出每个类别所获取的分词的TF-IDF词频,选取TF-IDF词频由高到低的第一预设数量的分词;
基于TF-IDF词频由高到低的第一预设数量的分词,计算每个分词的信息增益,选取信息增益由高到低的第二预设数量的分词;所述第二预设数量小于所述第一预设数量;
对所述第二预设数量的分词进行筛选、优化、组合,获取该类别的特征词。
于本发明一实施例中,所述模型建立模块执行以下操作:
获取各个类别的特征词的0/1变量和TF-IDF词频;当文本信息中包含某一特征词时,该特征词的0/1变量为1;当文本信息中不包含某一特征词时,该特征词的0/1变量为0;
基于特征词的0/1变量和TF-IDF词频,采用二分类Logistic回归算法构建信用评估模型。
另外,本发明还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述信用评估方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海前隆信息科技有限公司;福州云众数据科技有限公司,未经上海前隆信息科技有限公司;福州云众数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710651715.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种非税缴费业务处理系统
- 下一篇:基于互联网的信贷风险分散消化方法