[发明专利]一种征信报告解析方法、系统、终端设备和存储介质在审
申请号: | 202210010909.X | 申请日: | 2022-01-05 |
公开(公告)号: | CN114357970A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 徐亦飞;王超勇;朱利;王正洋;秦志强;张扬;张越皖 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/151 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 李红霖 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 报告 解析 方法 系统 终端设备 存储 介质 | ||
本发明提出了一种征信报告解析方法、系统、终端设备和存储介质,构建征信报告特征和征信报告特征组,并报告数据库中的征信报告标识,取出对应的征信报告,根据取出的征信报告,对征信报告特征进行计算;对征信报告所在文件夹内所有征信报告进行过滤、标记和计算,创建模型数据集,并将模型数据集保存至数据库。实现了同一个特征可以从不同格式的征信报告中,获取用户信息,并支持根据特定要求对用户信息的过滤,转化和函数计算,特征可以根据业务在线开发和计算,使征信报告的解析更加灵活,自动化和智能化,加快了征信报告的解析效率。解决了现有技术中针对不同样式的征信报告文件解析困难的问题。
技术领域
本发明属于金融业务技术领域,涉及一种征信报告解析方法、系统、终端设备和存储介质。
背景技术
在金融贷款业务中,征信报告有着举足轻重的地位,所有贷款业务都要使用征信报告进行风险评估,根据评估报告来开展自己的业务,所以每个金融机构都会成立自己的征信系统,来获取、解析和存储征信数据,这就造成了征信报告的多样性。例如在个人征信报告中就有着对象标记语言JavaScript objectNotation,JSON),可扩展标记语言(Extensible Markup Language,XML),HTML等不同的文档结构。这就对报告解析这个重要模块造成了很大的困难。目前大多数报告解析工作都只针对固定格式的征信报告,如何实现对各种样式的征信报告文件的解析,获取到用户信息是有待解决的问题。
发明内容
本发明的目的在于解决现有技术中的问题,提供一种征信报告解析方法、系统、终端设备和存储介质。
为达到上述目的,本发明采用以下技术方案予以实现:
一种征信报告解析方法,包括以下步骤:
S1:接收构建征信报告特征的相关信息,构建征信报告特征,将构建的征信报告特征存储至数据库中;
S2:对征信报告特征进行分组,创建征信报告特征组,将创建的征信报告特征组存储至数据库中;
S3:根据征信报告数据库中的征信报告标识,取出对应的征信报告,根据取出的征信报告,对征信报告特征进行计算;
S4:接收征信报告所在文件夹和征信报告特征组,对文件夹内所有征信报告进行过滤和标记,对所有征信报告特征进行计算,创建模型数据集,并将模型数据集保存至数据库。
本发明的进一步改进在于:
所述S1包括以下步骤:
接收输入的征信报告特征英文名和中文名,其中,中文名作为基本信息标识,英文名作为征信报告特征唯一标识;
将接收的信息封装为对象,并将对象序列化为JSON字符串,持久化到数据库中。
所述S3包括以下步骤:
生成征信报告反序列化的类文件,对征信报告进行反序列化,将其转化为CreditReport对象,并将CreditReport对象转化为ObjectTree结构对象,从ObjectTree中提取数据,同时对提取的数据进行映射和过滤并计算最终结果。
所述S3中,生成征信报告反序列化的类文件的方法为:
传入征信报告所在文件夹或者文件名,并将其反序列化,将反序列化生成的对象转化为StructNode结构,将所有征信报告得到的Tree合并为单目树,将合并后的单目树按照层级结构进行别名映射,读取配置文件,获取生成的类文件对应的Package。
所述S4包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210010909.X/2.html,转载请声明来源钻瓜专利网。