[发明专利]一种面向Hadoop集群的数据同步方法在审

专利信息
申请号: 201710122295.3 申请日: 2017-03-03
公开(公告)号: CN108540511A 公开(公告)日: 2018-09-14
发明(设计)人: 杨佩;胡宏;王一清;罗慧;刘梅招;高海龙;朱力鹏;胡斌 申请(专利权)人: 全球能源互联网研究院;国网江苏省电力公司;国家电网公司
主分类号: H04L29/08 分类号: H04L29/08
代理公司: 北京安博达知识产权代理有限公司 11271 代理人: 徐国文
地址: 102209 北京市昌平*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出了一种面向Hadoop集群的数据同步方法,包括在两个Hadoop集群间建立安全链接,集群A发送文件同步请求并发送自己的私钥给集群B,集群B用自己的公钥对集群A的私钥加密之后将加密获得密钥发送给集群A,集群A接收密钥并作为自己的公钥,继而建立了安全的连接。两个集群对文件数据块分别计算强弱校验和,在数据同步之前对比文件快的校验和数据,强弱校验和都相等的数据块则视为相同的文件file数据块,在文件同步传输时只传输差异的数据,相同的数据块不进行传输。接收数据的集群在接收到差异数据的同时将本地数据的差异想删除后添加从其他集群传输的数据组成新的数据。
搜索关键词: 集群 数据同步 数据块 校验和 传输 公钥 密钥 强弱 文件数据块 安全链接 差异数据 传输差异 对比文件 发送文件 接收数据 数据组成 私钥加密 同步请求 文件同步 私钥 加密 相等 删除 发送 安全
【主权项】:
1.一种面向Hadoop集群的数据同步方法,其特征在于,所述方法包括下述步骤:Step 1:集群在存储文件数据块时添加时间戳实现版本控制;Step 2:集群A向集群B之间首次需要数据同步时需要建立互信连接;Step 3:集群A产生一个随机密钥,用来自于集群B的公钥进行加密,将加密后的随机密钥发送给集群B;Step4:集群B接受密文后用自己的私钥解密数据获得通信密钥,集群A向集群B间建立了安全的通信连接;Step5:集群A向集群B同步文件file的文件信息以及在集群A中的索引信息;Step6:集群B接收到来自集群A发送的关于新上传的文件file的信息,查询本地集群A是否有文件file的存储记录;Step 7:判断集群B中是否存储过集群A中传送过来的文件file的历史版本;Step 8:对于集群A传输过来的文件file,集群B在本地存储文件file,并比较集群A和本地集群存储的文件file的时间戳信息后确定最新版本,对应选择不同的操作;Step 9:对比集群A和集群B的时间戳信息,并同步集群A和集群B的文件信息及索引信息;Step 10:确定集群A和集群B的Alder32校验和;Step 11:根据Alder32校验和,集群A比较文件file两个版本各数据块的弱校验值查找得到弱校验码相同的数据块,接着对弱校验值相同的数据块比较强校验值MD5值;Step 12:集群A确定需要的差异数据信息,并将差异数据信息传输给集群B。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于全球能源互联网研究院;国网江苏省电力公司;国家电网公司,未经全球能源互联网研究院;国网江苏省电力公司;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710122295.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top