[发明专利]实时数据同步方法、系统及框架有效

专利信息
申请号: 201711377062.4 申请日: 2017-12-19
公开(公告)号: CN108156230B 公开(公告)日: 2020-09-04
发明(设计)人: 张俊;邹晨俊;赵原 申请(专利权)人: 杭州有赞科技有限公司
主分类号: H04L29/08 分类号: H04L29/08
代理公司: 杭州裕阳联合专利代理有限公司 33289 代理人: 姚宇吉
地址: 310000 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 实时 数据 同步 方法 系统 框架
【说明书】:

发明提供了一种实时数据同步方法、系统及框架,其中,方法包括以下步骤:连接若干不同种类的源端存储系统;获取源端存储系统的消息,赋予消息名称、分发字段以及消息顺序将原有消息格式进行转换,以系统设定格式进行保存;读取并解析消息格式转换后的消息,根据消息内的消息顺序判断是否过时;若没有过时,则将消息转换成统一的消息输出格式,同时根据消息内包含的信息和键值存储数据系统配置相应主键和目标存储地址;根据目标存储地址分配相应消息发送接口,将消息内容同步写入目标存储系统的相应表中。本发明通过赋予消息顺序并依据消息顺序判断消息是否过时,将未过时的消息传输至目标存储系统中,避免实时消息同步过程中的出现乱序。

【技术领域】

本发明涉及实时数据同步技术领域,特别涉及一种实时数据同步方法、系统及框架。

【背景技术】

基于大数据技术各种分析的一个首要前提是需要有海量数据。海量数据的类型多种多样,如传感器收集的数据、服务端的日志以及关系数据库操作的binLog数据等等。在对这些数据进行分析或者挖掘前,需要进行ETL(Extract-Transform-Load,数据仓库技术)处理,其过程必然涉及到数据在各个不同存储系统之间进行移动。目前在离线统计分析中,对于海量数据在不同存储系统之间的导入导出已经存在像Sqoop(apache社区)或者dataX(阿里开源)这样比较成熟通用的同步引擎。但是在实时领域,目前只有flume在日志实时同步方面有着比较广的应用。但是由于在实时同步过程中,一个很重要的问题是处理消息乱序问题,即同一条记录连续两次更新,必须保证其顺序性,否则源端和目标端数据的一致性没法保证。目前,基于flume进行实时同步中,处理乱序问题是通过单通道来保证的。在要求消息有序的场景,并且消息量很大的时候,不能通过提高程序的并发度来提高吞吐量。所以其扩展性和并发性在这类场景中有着很大的局限性。

【发明内容】

本发明的目的是提供一种实时数据同步方法、系统及框架,解决现有上述的问题。

为解决上述问题,本发明实施例提供一种实时数据同步方法,包括以下步骤:

连接若干不同种类的源端存储系统;

获取源端存储系统的消息,赋予消息名称、分发字段以及消息顺序将原有消息格式进行转换,以系统设定格式进行保存;

读取并解析消息格式转换后的消息,根据消息内的消息顺序判断是否过时,若没有过时,则将消息转换成统一的消息输出格式,同时根据键值存储数据系统和消息内包含的信息配置相应主键和目标存储地址;

根据目标存储地址分配相应消息发送接口,将消息内容同步写入目标存储系统的相应表中。

作为一种实施方式,还包括以下步骤:

设置获取消息的最大条数。

本发明还提供一种实时数据同步系统,包括:

输入协议单元,连接若干不同种类的源端存储系统;

输入消息格式转化单元,获取源端存储系统的消息,赋予消息名称、分发字段以及消息顺序将原有消息格式进行转换,以系统设定格式进行保存;

消息过时判断单元,读取并解析消息格式转换后的消息,根据消息内的消息顺序判断是否过时;

输出消息格式转化单元,若没有过时,则将消息转换成统一的消息输出格式,同时根据键值存储数据系统和消息内包含的信息配置相应主键和目标存储地址;

输出协议单元,根据目标存储地址分配相应消息发送接口,将消息内容同步写入目标存储系统的相应表中。

作为一种实施方式,所述输入协议单元还包括消息条数模块,设置获取消息的最大条数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州有赞科技有限公司,未经杭州有赞科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711377062.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top