[发明专利]业务数据的处理方法、装置和服务器在审
申请号: | 202110889334.9 | 申请日: | 2021-08-04 |
公开(公告)号: | CN113590604A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 夏鹏 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/22;G06F16/23;G06F16/2455;G06F16/27;G06Q40/02 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 孙乳笋;刘熔 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 业务 数据 处理 方法 装置 服务器 | ||
本说明书提供了业务数据的处理方法、装置和服务器。基于该方法,在接收到新的目标业务数据后,可以先确定并根据基于文本字段的第一匹配度,确定新接收的目标业务数据是否属于当前已有的预设业务数据;在根据第一匹配度无法确定目标业务数据是否属于预设业务数据的情况下,再基于预设的取数规则,确定并根据基于数据值的第二匹配度,进一步确定该目标业务数据是否属于预设业务数据,从而可以基于文本字段和数据值两种不同的维度,高效、精准地确定出新接收的目标业务数据是否属于已有的预设业务数据,能较好地适用于结构复杂的分布式数据处理系统,准确、有效地对该系统所接入的大量不同来源的业务数据进行数据统一和数据管理。
技术领域
本说明书属于大数据处理技术领域,尤其涉及业务数据的处理方法、装置和服务器。
背景技术
在大数据处理场景中,分布式数据处理系统每时每刻都会接收到不同数据源(例如,不同的来源机构)传入的海量业务数据。
但是,由于不同数据源所使用的业务数据命名规则、业务数据处理方式、业务数据的统计口径等存在差异,导致分布式数据处理系统往往无法准确地辨识出实质相同的业务数据,难以对所接收到的业务数据进行较为有效的数据统一和数据管理,进而容易出现对系统中实质相同的业务数据进行重复处理,导致系统中存储的业务数据存在冗余、影响系统性能等技术问题。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本说明书提供了一种业务数据的处理方法、装置和服务器,能较好地适用于结构复杂的分布式数据处理系统,能够准确、有效地对该系统所接入的大量不同来源的业务数据进行数据统一和数据管理,避免对本质相同的业务数据进行重复处理。
本说明书实施例提供了一种业务数据的处理方法,包括:
获取目标业务数据,以及目标业务数据的要素信息;其中,所述目标业务数据的要素信息至少包括目标业务数据的名称字段和目标业务数据的业务定义文本;
根据所述目标业务数据的要素信息、预设的业务元数据表,计算目标业务数据与预设业务数据基于文本字段的第一匹配度;其中,所述预设的业务元数据表包含有业务数据库中保存的多个预设业务数据的要素信息和关联信息;
根据所述第一匹配度,确定所述目标业务数据是否属于预设业务数据;并在根据第一匹配度确定所述目标业务数据属于待定数据的情况下,确定出目标业务数据的相似业务数据;
根据预设的取数规则,通过与分布式存储系统进行相应交互,确定出目标业务数据与相似业务数据基于数据值的第二匹配度;
根据所述第二匹配度,确定所述目标业务数据是否属于预设业务数据。
在一些实施例中,所述预设业务数据的关联信息包括以下至少之一:预设业务数据的来源机构的机构标识、共享预设业务数据的应用的应用标识、预设业务数据的取数应用的应用标识、存储预设业务数据的数据值的子系统的系统标识、预设业务数据的属性类型标识。
在一些实施例中,根据所述目标业务数据的要素信息、预设的业务元数据表,计算目标业务数据与预设业务数据基于文本字段的第一匹配度,包括:
统计并根据目标业务数据的名称字段与预设业务数据的名称字段中相同字符的数量,确定第一匹配参数;
确定目标业务数据的业务定义文本与预设业务数据的业务定义文本的相似度,作为第二匹配参数;
根据所述第一匹配参数和第二匹配参数,确定目标业务数据与预设业务数据基于文本字段的第一匹配度。
在一些实施例中,根据所述第一匹配度,确定所述目标业务数据是否属于预设业务数据,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110889334.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置