[发明专利]一种企业信用数据处理方法及装置在审
申请号: | 202111472273.2 | 申请日: | 2021-12-03 |
公开(公告)号: | CN114138869A | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 李宪英;王建健;王巍;张昶洪;杨凯华 | 申请(专利权)人: | 爱信诺征信有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/25 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰 |
地址: | 100097 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 企业信用 数据处理 方法 装置 | ||
本申请涉及数据处理技术领域,特别涉及一种企业信用数据处理方法及装置。该包括:创建用于识别企业的企业唯一标识集合;获取多源企业信用数据,并基于目标企业的企业唯一标识集合,从所述多源企业信用数据中确定出与所述目标企业的企业唯一标识相匹配的目标企业信用数据;将所述目标企业信用数据转换成预设数据格式的企业信用数据;基于预设的各数据源的各维度数据的权重值,对转换成预设数据格式的企业信用数据进行数据融合处理。
技术领域
本申请涉及数据处理技术领域,特别涉及一种企业信用数据处理方法及装置。
背景技术
征信本质上属于信用信息服务,在实践中表现为专业化的机构依法采集、调查、保存、整理、提供企业和个人的信用信息,并对其资信状况进行评价,以此满足从事信用活动的机构在信用交易中对信用信息的需要,解决信息不对称的问题。
征信的核心离不开数据的支撑,目前工商注册企业有上亿个,基数非常庞大。企业信用数据涉及到的维度多种多样,例如工商信息、司法涉诉信息、知识产权信息、产品信息等。企业信用数据的获取方式也非常丰富,可以通过用户填报、通过技术手段抓取、数据采购、数据交换等,不同渠道获取到的数据的维度和数据质量不同,面对海量数据,针对多种来源的企业信用数据如何进行融合存储是急需解决的基础核心关键问题。
发明内容
本申请提供了一种企业信用数据处理方法及装置,用以解决现有技术中存在的无法对多源企业信用数据进行融合存储的问题。
第一方面,本申请提供了一种企业信用数据处理方法,所述方法包括:
创建用于识别企业的企业唯一标识集合;
获取多源企业信用数据,并基于目标企业的企业唯一标识集合,从所述多源企业信用数据中确定出与所述目标企业的企业唯一标识相匹配的目标企业信用数据;
将所述目标企业信用数据转换成预设数据格式的企业信用数据;
基于预设的各数据源的各维度数据的权重值,对转换成预设数据格式的企业信用数据进行数据融合处理。
可选地,一个企业的企业唯一标识集合至少包括:
所述一个企业的企业名称;和/或,
所述一个企业的统一社会信用代码;和/或,
所述一个企业的工商注册号。
可选地,将所述目标企业信用数据转换成预设数据格式的企业信用数据后,所述方法还包括:
基于预设的数据存储方式将所述转换成预设数据格式的企业信用数据存储至Hbase分布式存储系统中。
可选地,基于预设的各数据源的各维度数据的权重值,对转换成预设数据格式的企业信用数据进行数据融合处理的步骤包括:
判断所述转换成预设数据格式的企业信用数据中是否存在维度相同的多条企业信用数据;
若判定所述转换成预设数据格式的企业信用数据中不存在维度相同的多条企业信用数据,则将所述转换成预设数据格式的企业信用数据作为所述目标企业的企业信用数据。
可选地,所述方法还包括:
若判定所述转换成预设数据格式的企业信用数据中存在数据维度相同的多条企业信用数据,则将所述数据维度下权重值最高的数据源的企业信用数据作为所述目标企业在所述数据维度下的企业信用数据。
第二方面,本申请提供了一种企业信用数据处理装置,所述装置包括:
创建单元,用于创建用于识别企业的企业唯一标识集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于爱信诺征信有限公司,未经爱信诺征信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111472273.2/2.html,转载请声明来源钻瓜专利网。