[发明专利]面向HDFS/Hadoop存储集群的资源监控系统及方法有效

专利信息
申请号: 201310486601.3 申请日: 2013-10-17
公开(公告)号: CN103533058B 公开(公告)日: 2017-02-08
发明(设计)人: 卢义婉;叶保留;陆桑璐 申请(专利权)人: 南京大学镇江高新技术研究院
主分类号: H04L29/08 分类号: H04L29/08;H04L12/26
代理公司: 江苏圣典律师事务所32237 代理人: 贺翔
地址: 212000 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 面向 hdfs hadoop 存储 集群 资源 监控 系统 方法
【说明书】:

 

技术领域

发明涉及HDFS后台云存储的存储管理服务器名称节点、存储集群中的若干数据节点,具体是通过状态参考信息收集模块管理、心跳协议优化模块管理、参考信息处理模块管理,针对HDFS仅能对磁盘相关性能参数进行监控这一缺陷,设计并实现了资源监控模块,支持对多维资源信息的实时收集与管理,优化HDFS的心跳协议及相关数据结构,在支持多维信息更新的同时,增强了对节点动态加入的动态集成能力,为动态负载均衡优化设计提供了决策依据。

背景技术

近年来,随着网络及计算能力的不断提高,面向新型分布式环境的数据存储技术受到业界广泛关注,云存储更因资源聚集复用能力及扩展性强、易于部署而成为支持“大数据处理”的热点支撑技术而备受青睐。在面向海量数据存储的云存储应用领域,HDFS由于其良好特性和开源实现,渐渐成为云存储基本支撑平台的主流应用文件系统,无论在学术界还是工业界都有各种基于HDFS的研究和应用。

分布式云存储系统HDFS系统的应用场景是面对大规模用户的文件访问请求,工作负载主要来自于文件存储要求和访问请求,处理多集中于读和写为基础,但HDFS仅能对磁盘容量相关性能参数进行监控,没有针对读写性能优化提供支持的资源监控。针对此问题,本发明设计并实现了一种面向HDFS/Hadoop存储集群的资源实时监控方法,弥补了HDFS不能对影响数据读写性能的状态信息监控的缺陷,动态收集数据节点实时信息,并将信息数据传输到名称节点。

发明内容

本发明所要解决的技术问题是针对HDFS仅能对磁盘容量相关性能参数进行监控,没有针对读写性能优化提供支持的资源监控的局限性,提出了一种面向HDFS/Hadoop存储集群的资源实时监控系统及其监控方法,该系统收集数据读写性能相关的关键状态信息磁盘I/O使用率、CPU使用率和内存使用率,支持数据节点端多维资源信息的实时收集,名称节点端并以一定频率实时更新与管理,实现名称节点对于数据节点状态性能信息的实时监控和集中式管理。

本发明所述的一种面向HDFS/Hadoop存储集群的资源监控系统,包括HDFS存储管理服务器名称节点、HDFS存储集群中的若干数据节点,此外其还设有:

1)状态参考信息收集模块:部署在HDFS存储集群的数据节点上,收集数据读写性能相关的关键状态信息,支持数据节点端多维资源信息的实时收集与保存,并以一定频率实时更新与管理;

2)心跳协议优化模块:部署在HDFS存储集群的数据节点上,负责将节点参考信息传送到名称节点,以一定的频率实时获取数据节点的实时状态信息,通过优化心跳传输协议,以一定的频率RPC调用名称节点的传输方法,传送当前节点的实时状态信息,保证传送过去的数据最新,支持多维信息的推送;

3)参考信息处理模块:部署在HDFS存储管理服务器名称节点,名称节点得到实时状态数据后,通过优化相关数据结构和方法,处理数据节点传送过来的状态信息,更新和保存数据节点的最新性能状态参考信息,使名称节点端实时了解数据节点提供数据存储和访问的性能状态。

本发明还提供了一种面向HDFS/Hadoop存储集群的资源监控方法,其包括以下步骤:

1)从系统需要的角度,确定数据节点端收集的状态参考信息,将影响读和写性能的关键影响因素磁盘I/O使用率、CPU使用率和内存使用率这三者共同纳入资源监控的状态信息,加入类DatanodeStat用于存储上述三个新增入的状态信息;

2)数据节点启动后,后台收集状态信息的线程collectDatanodeStat在数据节点端实时获取集群中存储节点的实时状态信息,更新到DatanodeStat类实例中,保证它所记录的参考数据信息能反映当前节点的状态;

3)数据节点实时从DatanodeStat对象中获取数据节点的实时状态信息磁盘I/O使用率、CPU使用率和内存使用率,线程collectDatanodeStat在数据节点端实时获取集群中存储节点的实时状态信息;新加入的状态信息从源监控模块里得到,收集性能参考信息的线程不断的获取节点状态信息,并将数据保存到全局DatanodeStat类实例里,每收集一次信息就对其更新一次,保证数据最新;

4)心跳协议sendHeartbeat负责将数据节点的状态信息发送给名称节点,之后名称节点把心跳协议的工作移交给FSNamesystem的handleHeartbeat,更新名称节点中对这个数据节点的状态信息;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学镇江高新技术研究院,未经南京大学镇江高新技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310486601.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top