[发明专利]一种征信报告解析方法、系统、终端设备和存储介质在审

申请号：	202210010909.X	申请日：	2022-01-05
公开（公告）号：	CN114357970A	公开（公告）日：	2022-04-15
发明（设计）人：	徐亦飞;王超勇;朱利;王正洋;秦志强;张扬;张越皖	申请（专利权）人：	西安交通大学
主分类号：	G06F40/205	分类号：	G06F40/205;G06F40/151
代理公司：	西安通大专利代理有限责任公司 61200	代理人：	李红霖
地址：	710049 ***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种报告解析方法系统终端设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提出了一种征信报告解析方法、系统、终端设备和存储介质，构建征信报告特征和征信报告特征组，并报告数据库中的征信报告标识，取出对应的征信报告，根据取出的征信报告，对征信报告特征进行计算；对征信报告所在文件夹内所有征信报告进行过滤、标记和计算，创建模型数据集，并将模型数据集保存至数据库。实现了同一个特征可以从不同格式的征信报告中，获取用户信息，并支持根据特定要求对用户信息的过滤，转化和函数计算，特征可以根据业务在线开发和计算，使征信报告的解析更加灵活，自动化和智能化，加快了征信报告的解析效率。解决了现有技术中针对不同样式的征信报告文件解析困难的问题。

技术领域

本发明属于金融业务技术领域，涉及一种征信报告解析方法、系统、终端设备和存储介质。

背景技术

在金融贷款业务中，征信报告有着举足轻重的地位，所有贷款业务都要使用征信报告进行风险评估，根据评估报告来开展自己的业务，所以每个金融机构都会成立自己的征信系统，来获取、解析和存储征信数据，这就造成了征信报告的多样性。例如在个人征信报告中就有着对象标记语言JavaScript objectNotation,JSON)，可扩展标记语言(Extensible Markup Language,XML)，HTML等不同的文档结构。这就对报告解析这个重要模块造成了很大的困难。目前大多数报告解析工作都只针对固定格式的征信报告,如何实现对各种样式的征信报告文件的解析，获取到用户信息是有待解决的问题。

发明内容

本发明的目的在于解决现有技术中的问题，提供一种征信报告解析方法、系统、终端设备和存储介质。

为达到上述目的，本发明采用以下技术方案予以实现：

一种征信报告解析方法，包括以下步骤：

S1：接收构建征信报告特征的相关信息，构建征信报告特征，将构建的征信报告特征存储至数据库中；

S2：对征信报告特征进行分组，创建征信报告特征组，将创建的征信报告特征组存储至数据库中；

S3：根据征信报告数据库中的征信报告标识，取出对应的征信报告，根据取出的征信报告，对征信报告特征进行计算；

S4：接收征信报告所在文件夹和征信报告特征组，对文件夹内所有征信报告进行过滤和标记，对所有征信报告特征进行计算，创建模型数据集，并将模型数据集保存至数据库。

本发明的进一步改进在于：

所述S1包括以下步骤：

接收输入的征信报告特征英文名和中文名，其中，中文名作为基本信息标识，英文名作为征信报告特征唯一标识；

将接收的信息封装为对象，并将对象序列化为JSON字符串，持久化到数据库中。