[发明专利]一种基于MapReduce的监控数据优先预取处理方法在审
| 申请号: | 201410604052.X | 申请日: | 2014-10-31 |
| 公开(公告)号: | CN104331464A | 公开(公告)日: | 2015-02-04 |
| 发明(设计)人: | 廖福玮;罗开明;张新坡;刘岩 | 申请(专利权)人: | 许继电气股份有限公司;许昌许继软件技术有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 郑州睿信知识产权代理有限公司 41119 | 代理人: | 胡泳棋 |
| 地址: | 461000 河*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 mapreduce 监控 数据 优先 处理 方法 | ||
1.一种基于MapReduce的监控数据优先预取处理方法,其特征在于,该处理方法包括以下步骤:
1)构建Hadoop分布式系统,包括主节点和从节点,主节点和从节点上均安装JDK和Hadoop软件,并添加有JAVA环境变量;
2)将数据集进行节点预选找到空闲节点作为候选工作计算节点;
3)在确定候选计算节点集之后,在预先选出待预取的map任务;
4)根据筛选出的候选节点和待预取map任务对数据进行预取。
2.根据权利要求1所述的基于MapReduce的监控数据优先预取处理方法,其特征在于,所述步骤1)中主节点和从节点计算机安装Hadoop软件时,需对conf目录下的6个核心配置文件进行相应配置,这6个配置文件分别是hadoop-env.sh、core-site.xml、mapred-site.xml、hdfs-site.xml、masters和slaves文件。
3.根据权利要求2所述的基于MapReduce的监控数据优先预取处理方法,其特征在于,所述hadoop-env.sh文件用于配置所使用的JDK版本及所处位置;core-site.xml文件用于配置HDFS文件系统的名称、访问入口地址及端口信息;mapred-site.xml文件用于配置JobTracker的入口地址及端口;hdfs-site.xml文件用于配置HDFS副本数;而masters和slaves文件分别用于指定主节点和从节点所对应的机器。
4.根据权利要求3所述的基于MapReduce的监控数据优先预取处理方法,其特征在于,所述主节点主要负责Hadoop两个关键功能模块HDFS、MapReduce的监督,当JobTracker使用MapReduce进行监控和调度数据的并行处理时,NameNode则负责HDFS监视和调度,从节点负责机器运行的绝大部分,担当所有数据储存和指令计算,每个从节点既扮演者数据节点的角色又承担与它们主节点通信的守护进程。
5.根据权利要求4所述的基于MapReduce的监控数据优先预取处理方法,其特征在于,所述步骤2)如果在选中的候选节点上进行资源预取操作,需要保证在当前正在运行的任务结束之前就完成预取。
6.根据权利要求5所述的基于MapReduce的监控数据优先预取处理方法,其特征在于,所述步骤2)中节点预选的具体过程如下:
(a)利用计算节点上当前正在运行任务的执行进度来推测其最大剩余执行时间estimatedLeftTime;
(b)根据网络设备的理论传输速率计算出节点间传输一个文件块所需要的时间timePerBlock;
(c)依据正在该节点上运行的任务中存在剩余完成时间小于传输一个数据块所需时间的map任务,判断该节点马上就会释放忙碌计算槽(slots),意味着在预取完成之前此计算节点就会变为空闲节点,无需再执行后续的预取操作;
(d)对节点上每个map任务的剩余完成时间estimatedLeftTime与节点间传输一个文件块所需时间进行比较,若计算节点存在estimatedLeftTime<timePerBlock的map任务,则退出本次预取操作;反之,则选取estimatedLeftTime<timePerBlock的计算节点加入candidateTTs集合中,作为候选节点的备选集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于许继电气股份有限公司;许昌许继软件技术有限公司,未经许继电气股份有限公司;许昌许继软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410604052.X/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





