[发明专利]一种大数据中转传输同步及存储方法有效
申请号: | 201510400002.4 | 申请日: | 2015-07-09 |
公开(公告)号: | CN105049504B | 公开(公告)日: | 2019-03-05 |
发明(设计)人: | 郭宇;艾建文;季统凯 | 申请(专利权)人: | 国云科技股份有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 广东莞信律师事务所 44332 | 代理人: | 余伦 |
地址: | 523808 广东省东莞市松山湖高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 中转 传输 同步 存储 方法 | ||
本发明涉及数据传输与同步技术领域,尤其是一种面向不同网域之间的大数据中转传输同步及存储方法。本发明所述的方法是处于不同网域的分布式集群之间,通过一个网络中拥有公共IP的节点作为名称节点,存储其他位于局域网内的数据节点映射信息与块信息;名称节点所在网域中选择性搭建起HDFS作为中转服务器的存储系统;客户端集群之间,通过与中转服务器的通信,根据所属具体网络环境,通过中转服务器的存储系统作为跳板,传输所需海量大数据;数据传输所用HDFS接口采用RESTful风格发布作为webHDFS的变种实现;在中转服务器各数据节点中建立数据完整性校验机制,保证数据完整与安全。本发明可以应用于跨域分布式海量数据的传输、同步中。
技术领域
本发明涉及数据传输与同步技术领域,尤其是一种面向不同网域之间的大数据中转传输同步及存储方法。
背景技术
随着信息技术的快速发展,数据信息量的爆炸式增长,传统的数据存储及处理的模式已经难以满足当今时代对于高速、灵敏反应的需求,而分布式和虚拟化技术的应用带来了解决方案的同时,也提出了其他方面的要求及问题,分布式间大数据的传输也成为其中一个关键问题。如何解决快速、安全、稳定的跨网传输成为关注的热点,在Hadoop分布式文件系统中出现的webHDFS给出了一个解决该问题的可能性。
发明内容
本发明解决的技术问题在于提供一种面向不同网域之间的大数据中转传输同步及存储方法;实现海量数据传输、数据完整性校验、分布式文件存储、HDFS的RESTful接口定义使用以及点对点大数据同步的中转。
本发明解决上述技术问题的技术方案是:
所述的方法是处于不同网域的分布式集群之间,通过一个网络中拥有公共IP的节点作为名称节点,存储其他位于局域网内的数据节点映射信息与块信息;名称节点所在网域中选择性搭建起HDFS作为中转服务器的存储系统;客户端集群之间,通过与中转服务器的通信,根据所属具体网络环境,通过中转服务器的存储系统作为跳板,传输所需海量大数据;数据传输所用HDFS接口采用RESTful风格发布作为webHDFS的变种实现;在中转服务器各数据节点中建立数据完整性校验机制,保证数据完整与安全。
所述的方法中,如果需要进行传输的数据位于异地分布式集群且在传输过程中客户端双方无法直接取得连接;则通过存储在中转服务器名称节点上的信息,获取到客户端所需同步传输模块所在地址,通过RESTful的HDFS接口于TCP/IP之上将位于不同数据节点上的数据并发传输至中转服务器的存储系统,传输完成后通过MD5完成数据完整校验,如果数据传输过程中出现丢包,则等待重传直到传输完整或任务失败;在待同步数据传输至中转服务器后,利用相同原理连接另一个客户端,将数据并发传输至其各数据节点完成同步。
所述的方法中,HDFS分布式文件存储工作流程是:处于客户端的分布式集群数据节点通过统一网关与外界因特网相连,拥有公用对外ip地址,处于服务器端各数据节点可拥有独立公有Ip地址,其信息存储在服务器名称节点中;客户端数据节点集群与服务器名称节点集群建立一对多连接关系,并发将客户端各数据节点中数据发送至中转服务器的存储系统。
当MD5码校验成功,则将本块信息冗余至另外2个数据节点,并返回成功标志;当MD5码指示传输丢包后,根据当前传输块信息,从名称节点中获取块信息与索引信息,从拥有该块的数据节点中随机选择一个节点完成重传,达到负载均衡。
所述方法的主要步骤是:
S1.服务器名称节点检查读写请求的目标文件是否存在,权限是否满足,满足则进入下一步S2,否则向客户端报告异常;
S2.读写文件之前,数据节点先将文件切分为多个包,向名称节点申请块空间存储数据节点列表;
S3.以packet作为传输基本单元,从数据节点中读取或写入所需的数据块;完成一个数据节点的读写后,继续下一个数据节点的读写;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国云科技股份有限公司,未经国云科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510400002.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置