[发明专利]一种基于Hadoop平台的电力数据作业调度方法在审
申请号: | 201710986117.5 | 申请日: | 2017-10-20 |
公开(公告)号: | CN107656805A | 公开(公告)日: | 2018-02-02 |
发明(设计)人: | 林斌;曾瑛;李星南;施展;朱文红;汪莹 | 申请(专利权)人: | 广东电网有限责任公司电力调度控制中心 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F9/50;G06Q50/06 |
代理公司: | 广州粤高专利商标代理有限公司44102 | 代理人: | 林丽明 |
地址: | 510099 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 hadoop 平台 电力 数据 作业 调度 方法 | ||
1.一种基于Hadoop平台的电力数据作业调度方法,其特征在于,包括如下步骤:
S1、提交任务并初始化等待队列;
S2、确定当前任务,判断当前任务的类型,将当前任务分配到步骤S1中相应类型的队列中;
S3、判断节点类型,并从任务队列中取出与节点相应类型的任务;
S4、判断有没有慢任务,如果有慢任务就在另一个节点上备份任务并执行,如果没有慢任务就让其继续执行下去。
2.根据权利要求1所述的基于Hadoop平台的电力数据作业调度方法,其特征在于,步骤S1具体包括:
S11、用户在客户端中选取要执行的作业,并将它提交到等待队列W={wi}中,其中wi为等待队列内元素,i=1,2,…,N,其中,N为等待队列内元素总个数。
3.根据权利要求2所述的基于Hadoop平台的电力数据作业调度方法,其特征在于,步骤S2具体包括:
S21、从W={wi}中取出当前任务T,计算该任务的输入数据的总量σin和任务的输出数据总量σout;计算当前任务完成时间τfinish,通过公式(σin+σout)/τfinish计算出此时任务的I/O速度;
S22、若此时任务的I/O速度满足大于磁盘I/O速度,即(σin+σout)/τfinish>vI/O时,则判断为I/O密集型的任务,加入I/O密集型队列O={pi},其中,vI/O为磁盘I/O速度,O={pi}为I/O密集型队列,pi为I/O密集型队列内元素,i=1,2,…,M,其中,M为I/O密集型队列内元素总个数;
若此时任务的I/O速度满足小于磁盘I/O速度,即(σin+σout)/τfinish<vI/O时,则判断为CPU密集型的任务,加入CPU密集型队列U={qi}其中,U={qi}为CPU密集型队列,qi为CPU密集型队列内元素,i=1,2,…,L,其中,L为CPU密集型队列内元素总个数。
4.根据权利要求3所述的基于Hadoop平台的电力数据作业调度方法,其特征在于,步骤S3具体包括:
S31、获取到磁盘I/O速度vI/O,CPU使用率vCPU,I/O的使用率阈值ΓI/O,CPU使用率的阈值ΓCPU;
S32、判断是否满足
如果不满足两个比值小于1,证明该节点是一个负载很大的节点,就放弃它寻找其他节点;
如果满足则说明该节点是一个负载较小的,I/O使用率较小的,适用于I/O密集型任务的节点;
如果满足则说明该节点是一个负载较小的,CPU使用率较小的,适用于CPU密集型任务的节点。
5.根据权利要求4所述的基于Hadoop平台的电力数据作业调度方法,其特征在于,步骤S4具体包括:
S41、记录系统中运行过的任务总数numT,系统启动时间τstart,当前系统时间τnow,系统总数据输入量系统总数据输出量计算系统总数据处理量计算任务的平均处理速度
S42、在单位时间(一分钟内)计算数据瞬时处理速度vnow,比较当前任务瞬时速度vnow与任务的平均处理速度vavg,如果vnow≥vavg,那么则此任务不是慢任务,则在此节点继续执行下去;如果vnow<vavg,那么判定此任务为慢任务,并复制到其他节点执行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司电力调度控制中心,未经广东电网有限责任公司电力调度控制中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710986117.5/1.html,转载请声明来源钻瓜专利网。