[发明专利]批量数据同步方法、系统及电子设备在审
申请号: | 202110156442.5 | 申请日: | 2021-02-04 |
公开(公告)号: | CN112948486A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 闫宇新;袁孝锋 | 申请(专利权)人: | 北京淇瑀信息科技有限公司 |
主分类号: | G06F16/27 | 分类号: | G06F16/27;G06F16/23;G06F16/242;G06F16/2455;G06F16/17;G06F9/445 |
代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 何怀燕 |
地址: | 100012 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 批量 数据 同步 方法 系统 电子设备 | ||
本公开涉及一种批量数据同步方法、系统、电子设备及计算机可读介质。该方法包括:大数据分布式流数据流引擎将待同步数据存储到分布式文件系统的第一预设位置;异构数据源离线同步框架将所述待同步数据的历史数据存储到所述分布式文件系统的第二预设位置;数据仓库工具将所述待同步数据按照预设规则分区存储;在预设时间将所述分区存储的待同步数据进行批量合并以实现所述待同步数据的批量同步。本公开涉及的批量数据同步方法、系统、电子设备及计算机可读介质,能够解决现有技术中存在的批量数据同步的时效性差的问题,快速准确的进行批量数据的同步,不会增加网络负担。
技术领域
本公开涉及计算机信息处理领域,具体而言,涉及一种批量数据同步方法、系统、电子设备及计算机可读介质。
背景技术
数据库操作往往会成为一个系统的瓶颈所在,而且一般的系统“读”的压力远远大于“写”,可以通过实现数据库的读写分离来提高系统的性能。通过设置主从数据库实现读写分离,主数据库负责“写操作”,从数据库负责“读操作”,根据压力情况,从数据库可以部署多个提高“读”的速度,借此来提高系统总体的性能。要实现读写分离,就要解决主从数据库数据同步的问题,在主数据库写入数据后要保证从数据库的数据也要更新。
Sqoop即SQL-to-Hadoop,是连接传统关系型数据库和Hadoop的桥梁,用于把关系型数据库的数据导入到Hadoop系统(如HDFS HBase和Hive)中;也可以把数据从Hadoop系统里抽取并导出到关系型数据库里。Sqoop利用MapReduce加快数据传输速度,并且采用批处理方式进行数据传输。但是,在通过Sqoop进行数据同步的过程中,需要消耗SQL注入安全检测工具中大量的指访问控制列表,而且Sqoop离线同步数据的时候传输数据比较慢。
为了解决现有技术中的困境,本公开提出一种新的批量数据同步方法、系统、电子设备及计算机可读介质。
在所述背景技术部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本公开提供一种批量数据同步方法、系统、电子设备及计算机可读介质,能够解决现有技术中存在的批量数据同步的时效性差的问题,快速准确的进行批量数据的同步,不会增加网络负担。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一方面,提出一种批量数据同步方法,该方法包括:大数据分布式流数据流引擎将待同步数据存储到分布式文件系统的第一预设位置;异构数据源离线同步框架将所述待同步数据的历史数据存储到所述分布式文件系统的第二预设位置;数据仓库工具将所述待同步数据按照预设规则分区存储;在预设时间将所述分区存储的待同步数据进行批量合并以实现所述待同步数据的批量同步。
可选地,还包括:分布式发布订阅消息系统获取业务相关数据。
可选地,大数据分布式流数据流引擎将待同步数据存储到分布式文件系统的第一预设位置之前,包括:所述大数据分布式流数据流引擎通过消费方式获取所述业务相关数据;基于所述业务相关数据获取所述待同步数据。
可选地,大数据分布式流数据流引擎将待同步数据存储到分布式文件系统的第一预设位置,包括:大数据分布式流数据流引擎获取任务元数据的配置信息;基于所述任务元数据的业务属性对所述待同步的表进行解析;将解析后的所述待同步的表存储到分布式文件系统的第一预设位置。
可选地,将解析后的所述待同步的表存储到分布式文件系统的第一预设位置,包括:将所述待同步的表进行sink解析以生成所述待同步数据;将所述待同步的表存储到Hadoop Distributed File System系统的第一预设位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京淇瑀信息科技有限公司,未经北京淇瑀信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110156442.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:活动分析方法、装置和电子设备
- 下一篇:增光膜、背光模组以及显示装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置