[发明专利]一种基于异构Hadoop集群的任务调度方法有效

专利信息
申请号: 201810168415.8 申请日: 2018-02-28
公开(公告)号: CN108469988B 公开(公告)日: 2021-12-17
发明(设计)人: 吴奇石;王猛;侯爱琴;张晓阳;王永强 申请(专利权)人: 西北大学
主分类号: G06F9/48 分类号: G06F9/48;G06F9/50
代理公司: 西安恒泰知识产权代理事务所 61216 代理人: 李婷;周春霞
地址: 710069 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 hadoop 集群 任务 调度 方法
【说明书】:

发明公开一种基于异构Hadoop集群的任务调度方法,该方法根据集群中每个节点的实时性能,并考虑到每个节点和不同任务的匹配程度,来对Hadoop中任务队列中的任务进行调度。解决了现有调度技术只能针对大数据中心同构集群,以及现有的调度算法集群的资源利用率低,集群节点负载不均衡以及作业完成时间比较长的缺陷。

技术领域

本发明属于大数据相关领域,涉及一种基于异构Hadoop集群的任务调度方法。

背景技术

随着互联网应用的快速发展,互联网迎来了web2.0时期,人类已经正式进入了信息爆炸的时代,互联网中的信息量以指数的速度增长着。很多领域都在产生大量的数据。例如,在物联网领域,我们使用的各种传感器、可穿戴设备等无时无刻都在产生数据。在电子商务领域,当我们浏览商品、加入购物车和下订单时也会产生大量数据。在社交领域,我们通讯也会产生大量的视频、音频数据和文本数据。此外,社交网络应用中记录用户行为日志通常都是以GB甚至是TB为单位的。相对于传统的关系型数据的存储和计算,这些每天产生的数据大多都是非关系性的、而且没有固定格式的数据。当数据量达到一定的规模时,常规的单机计算模式已经无法满足用户的需求。为了解决这种情况,提出了分布式计算框架与云计算。框架本身通常允许管理处理数据的可执行程序,通常称为应用程序或作业。在过去的几年里,一些分布式计算框架已经被开发出来,其中有几个受到了广泛的应用。与其他分布式计算框架相比,MapReduce更受欢迎。MapReduce被应用在Hadoop平台,Hadoop是一个开源的分布式存储和处理系统,是由Apache基于Google发表的两篇论文提出了一种大数据处理平台。目前一些知名的公司都有自己的Hadoop集群,例如Yahoo,Google,Ebay和Amazon。Hadoop的应用范围非常广泛,主要适用于结构化、半结构化和非结构化数据的搜索、数据分析和数据挖掘。例如分布式排序,日志分析,构建反向索引和机器学习等。

Hadoop的发展经历两个阶段:Hadoop 1.0和Hadoop 2.0。在Hadoop 1.0中,MapReduce(也被称为MRv1)分布式处理框架是Hadoop中的唯一计算框架,它不仅能够用于离线处理大规模非结构化数据,而且能将很多繁琐的细节隐藏,比如,自动并行化、负载均衡和灾备管理等,极大地简化了开发工作,同时,与传统的大多数分布式处理框架相比,MapReduce的伸缩性优势明显,因此,MRv1最初推出的几年,有众多的成功应用案例,并获得业界的广泛支持和肯定。但随着分布式系统集群的规模和其工作负荷的增长,特别是支持其他实时计算框架的需求越来越多,包括内存计算框架(Spark)、流式计算框架(Storm)、迭代式计算框架(iMapReduce)等新型计算框架的出现,MRv1计算框架的局限性日益突出,主要包括扩展性差、资源利用率低、存在单点故障、计算框架单一等问题。为此,Hadoop 2.0提出一种新的资源管理系统YARN(Yet Another Resource Negotiator,也被称为MRv2),一个多种计算框架通用的资源调度体系,为不同的并行化计算提供资源分配服务。这样,YARN支持的计算框架只要实现YARN定义的接口,便可以运行在YARN之上,从而很好地打造一个以YARN为核心的生态系统。由于YARN具有灵活且支持多计算框架的架构设计、主结点功能的分离、资源调度机制的改进、资源的隔离和Hadoop原生支持等诸多特性,它目前已经成了新一代资源管理的典型代表。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810168415.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top