[发明专利]一种基于知识图谱和图深度学习的金融信用风险评估方法在审
申请号: | 202010515785.1 | 申请日: | 2020-06-09 |
公开(公告)号: | CN111652704A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 唐松;黄锐 | 申请(专利权)人: | 唐松;黄锐 |
主分类号: | G06Q40/00 | 分类号: | G06Q40/00;G06N3/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510520 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 深度 学习 金融 信用风险 评估 方法 | ||
本发明属于金融信用风险评估领域,具体公开了一种基于知识图谱和图深度学习的金融信用风险评估方法,包括如下步骤:获取用户历史信用数据;根据信用数据构建用户知识图谱;利用图神经网络对用户知识图谱进行图深度学习,得到知识图谱的特征;利用知识图谱的特征表征用户的信用特征;基于所述用户信用特征,通过风险评估模型对所述用户进行金融信用风险评估,并通过softmax函数判别用户是否存在风险。本发明采用知识图谱和图深度学习的方式对用户的金融信用风险进行评估,能够对用户历史信用数据中的结构化数据、半结构化数据和非结构化数据进行预处理、提取、分析,并将其作为评价用户金融信用的重要依据,提高评估质量,评估效率高。
技术领域
本发明涉及金融信用风险评估相关领域,具体为一种基于知识图谱和图深度学习的金融信用风险评估方法。
背景技术
21世纪以来,随着计算机技术的日新月异和数据挖掘技术的兴起,个人信用评估正朝着数据库化,系统化,高精度量化的方向发展。采用数据挖掘技术进行的信用评估研究目前逐渐被国内外学术机构和商业银行所重视。数据挖掘技术不但可以从客观数据出发,总结出规律,建立个人信用评分模型,通过定性和定量两个角度,更加全面、科学的进行个人信用评估;而且能够充分利用计算机的快速处理的特点,极大的加快整个信用评估的过程,缩短信贷决策的时间。
发明内容
本发明的目的在于提供一种基于知识图谱和图深度学习的金融信用风险评估方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于知识图谱和图深度学习的金融信用风险评估方法,包括如下步骤:
S1:获取用户历史信用数据;
S2:根据信用数据构建用户知识图谱;
S3:利用图神经网络对用户知识图谱进行图深度学习,得到知识图谱的特征;
S4:利用知识图谱的特征表征用户的信用特征;
S5:基于所述用户信用特征,通过风险评估模型对所述用户进行金融信用风险评估,并通过softmax函数判别用户是否存在风险。
作为本发明一种优选的技术方案,S1中历史信用数据包括结构化数据、半结构化数据和非结构化数据。
作为本发明一种优选的技术方案,S2中具体包括:S21:对结构化数据、半结构化数据和非结构化数据进行处理预处理;S22:对预处理后的非结构化数据、半结构化和结构化信用数据进行知识抽取,并将抽取后的数据加入数据库;S23:对知识库进行知识融合,包括实体消歧、共指消解;S24:采用自底向上构建数据模型,完成结构化、网络化的知识表示;S25:根据已有的数据模型进行知识推理、知识发现,完成用户知识图谱的构建。
作为本发明一种优选的技术方案,S21中数据预处理包括:S211:读取文本:获得字的部首的全集chars_set,bios_set,relations_set;S212:遍历训练数据:将每个句子中token_id,token,bio,relations,heads作为列表封装到该句子中;S213:遍历当前句子将样本数据id化,将句子中字列表embedding_ids,偏旁部首id的列表char_ids,实体标签的列表bio_ids,关系的列表scoringMatrixHeads封装到句子中;S214:处理句子id化的数据,使其在一个批量数据内每个句子的维度相等,已最长句子的维度作为最大维度,不足的填充0;上述token为句子中的字,relations为实体关系,heads为对应关系下标位置。
作为本发明一种优选的技术方案,S22中对非结构化数据进行知识抽取包括:S221:从所述非结构化数据中基于相关度提取关键数据,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于唐松;黄锐,未经唐松;黄锐许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010515785.1/2.html,转载请声明来源钻瓜专利网。