[发明专利]数据对账方法及相关装置有效
申请号: | 201910736400.1 | 申请日: | 2019-08-09 |
公开(公告)号: | CN110543472B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 王亮;何林强 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/242;G06F16/2458;G06F16/25 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 李庆波 |
地址: | 310051 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 方法 相关 装置 | ||
本申请公开了一种数据对账方法及相关装置。其中,数据对账方法包括:获取到目的端在设定时间段内从源端接收到的实际数据量;利用每条数据的对账编号获取到设定时间段内从源端接收到的理论数据量;其中,对账编号包括数据的分区的编号以及偏移量,每个分区内的偏移量连续递增;判断实际数据量与理论数据量是否相等;如果实际数据量与理论数据量不相等,补充缺失的数据或删除重复的数据。上述方案,能够减少数据对账时长、提高数据对账效率。
技术领域
本申请涉及数据处理技术领域,特别是涉及一种数据对账方法及相关装置。
背景技术
随着信息技术的快速发展,人们在日常生活中进行网购、聊天都会产生出海量数据。为了突破集中式存储处理海量数据时在可靠性、安全性等方面的瓶颈,逐渐发展出了分布式存储技术,例如Kafka消息队列等等。
在数据实时同步的场景下,特别是在跨网数据传输过程中,当出现网络不稳定、服务器异常、消息积压等异常情况时,源端数据库和目的端数据库的数据可能会不一致,例如:目的端数据库数据缺失,或者目的端数据库数据重复。为了补充缺失数据、消除重复数据,有必要对源端数据库和目的端数据库进行数据对账。目前,数据对账需要针对业务表全表进行数据对账。然而,在面对海量数据时,采用全表数据对账存在对账耗时长、对账效率低的问题。有鉴于此,如何减少数据对账耗时、提高数据对账效率成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种数据对账方法及相关装置,能够减少数据对账时长、提高数据对账效率。
为了解决上述问题,本申请第一方面提供了一种数据对账方法,包括:获取到目的端在设定时间段内从源端接收到的实际数据量;利用每条数据的对账编号获取到设定时间段内从源端接收到的理论数据量;其中,对账编号包括数据的分区的编号以及偏移量,每个分区内的偏移量连续递增;判断实际数据量与理论数据量是否相等;如果实际数据量与理论数据量不相等,补充缺失的数据或删除重复的数据。
为了解决上述问题,本申请第二方面提供了一种数据对账装置,包括实际数据量获取模块、理论数据量获取模块、判断模块以及响应模块;实际数据量获取模块用于获取到目的端在设定时间段内从源端接收到的实际数据量;理论数据量获取模块用于利用每条数据的对账编号获取到设定时间段内从源端接收到的理论数据量;其中,对账编号包括数据的分区的编号以及偏移量,每个分区内的偏移量连续递增;判断模块用于判断实际数据量与理论数据量是否相等;响应模块用于在实际数据量与理论数据量不相等时,补充缺失的数据或删除重复的数据。
为了解决上述问题,本申请第三方面提供了一种数据对账装置,包括相互耦接的存储器和处理器;处理器用于执行存储器存储的程序指令,以实现上述第一方面的方法。
为了解决上述问题,本申请第四方面提供了一种存储装置,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面的方法。
上述方案中,当存在设定时间内目的端从源端接收到的实际数据量,以及设定时间段内从源端接收到的理论数据量之间不相等的情况时,可以确定目的端存在数据重复或数据缺失,由于无需针对业务表全表进行数据对账,只需比较在设定时间段内的数据量,故此,可以节省数据对账时间,从而提升数据对账效率。
此外,当源端采用Kafka消息队列时,由于无法基于Kafka集群内部的磁盘数据进行结构化查询语言(Structured Query Language,SQL)运算而获取理论数据量,然而,本方案采用每条数据的对账编号获取设定时间段内从源端接收到的理论数据量,从而只需统计目的端接收到的数据,无需对源端进行SQL运算,进而可以大大提高对于各类数据库的兼容性。
附图说明
图1是本申请数据对账方法一实施例的流程示意图;
图2是Kafka消息队列的Topic存储格式示意图;
图3是图1中步骤S12一实施例的流程示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910736400.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置