[发明专利]hadoop系统中从属节点服务自动恢复方法有效
申请号: | 201310258124.5 | 申请日: | 2013-06-26 |
公开(公告)号: | CN103327105A | 公开(公告)日: | 2013-09-25 |
发明(设计)人: | 井淑明 | 申请(专利权)人: | 北京汉柏科技有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 100022 北京市朝阳区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | hadoop 系统 从属 节点 服务 自动 恢复 方法 | ||
技术领域
本发明涉及计算机分布式计算领域,特别涉及一种Hadoop系统中从属节点服务自动恢复方法。
背景技术
Hadoop是一个能够让用户轻松架设和使用的分布式计算平台,Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件上的分布式文件系统,具有高效性、高扩展性、高容错性,可移植性等优点。因此hadoop是架设大型数据中心的最佳选择。hadoop存在唯一的主控节点(也称为namenode)和多个从属节点,主控节点负责管理文件系统名称空间和控制外部客户机的访问,并将任务分配给从属节点去执行。传统的Hadoop分布式集群的架设和启动过程:1、首先是启动一个节点作为主控节点,并将主控节点的数据存储在本地;2、启动其他节点作为从属节点,从属节点启动后,主动联系主控节点进行注册和信息同步,建立起hadoop分布式文件系统。
在主控节点和从属节点的本地数据中,都存储着一个全局的namespaceID,在从属节点联系主控节点时,只有namespaceID与主控节点的namespaceID一致,从属节点才能加入Hadoop系统中,提供服务。在实际应用中,从属节点的服务器由于断电等异常情况导致重启,重启后经常会出现所存储的namespaceID和主控节点的namespaceID不一致,导致本节点不能加入hadoop系统中,从而不能够恢复从属节点的服务,往往恢复的手段是管理员找到所有异常的节点,手动的改变从属节点的namespaceID与主控节点一致,由于hadoop应用的场景多是大型的数据中心,排查和更改都是一个繁重的工作,且引入了人为操作失误的风险。
发明内容
(一)所要解决的技术问题
针对上述问题,本发明提供了一种Hadoop系统中从属节点服务自动恢复方法,避免了人为操作失误的风险。
(二)技术方案
本发明提供一种hadoop系统中从属节点服务自动恢复方法,该方法包括:
S1、在节点集群中部署Gluster分布式文件存储系统,提供存储空间;
S2、在主控节点上挂载所述存储空间,配置主控节点,并完成hadoop系统的建立,所述配置包括:将所述主控节点的数据存储在所述存储空间;
S3、从属节点恢复服务,包括:将所述存储有主控节点数据的存储空间挂载到所述从属节点本地,并查看所述从属节点本地的namespaceID与所述存储空间中的namespaceID是否相同,若不同则将从属节点本地的namespaceID修改为存储空间的namespaceID,从属节点启动服务。
其中,还包括步骤S4:从属节点服务恢复后卸载挂载在从属节点的所述存储有主控节点数据的存储空间。
其中,所述步骤S1包括:
任意选择集群中的3个节点,在每个节点上启动Gluster服务器服务,该服务将所在节点上的部分磁盘提供出来,结合构成Gluster分布式文件存储系统的存储空间;在每个节点上部署Gluster客户端服务。
(三)有益效果
本发明提供了一种Hadoop系统中从属节点服务自动恢复方法,通过使用Gluster分布式文件存储系统,令主控节点的数据可一直不断写入挂载的存储空间中,利用Gluster系统,并不需要额外架设存储设备,只需在原有的节点上启动一些服务,部署成本基本为0,并且Gluster的访问很灵活;通过将Gluster系统的存储空间临时挂载在从属节点本地,查看全局namespaceID是否相同,不同则修改,再启动恢复从属节点服务,该恢复过程完全自动控制,避免了人为查找和更改工作,降低人为操作失误的风险和人力成本的投入。
附图说明
图1为本发明方法提供的步骤流程图。
具体实施方式
本发明提供了一种hadoop系统中从属节点服务自动恢复方法,本发明中的节点指的是物理服务器,节点集群即是服务器集群,在所有的节点中选择一个启动hadoop系统的主控(即master)的服务,这台就是主控节点,其他节点启动hadoop系统的从属(slave)服务,称为从属节点,这样就构成了一个hadoop服务的节点集群。如图1所示该方法步骤流程为:
S1、在节点集群中部署Gluster分布式文件存储系统,提供存储空间;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京汉柏科技有限公司,未经北京汉柏科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310258124.5/2.html,转载请声明来源钻瓜专利网。