[发明专利]一种集群智能负载管理的方法在审
申请号: | 201310695452.1 | 申请日: | 2013-12-18 |
公开(公告)号: | CN103645956A | 公开(公告)日: | 2014-03-19 |
发明(设计)人: | 焦芬芳 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F1/32 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250014 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 集群 智能 负载 管理 方法 | ||
技术领域
本发明涉及计算机应用技术领域,具体的说是一种集群智能负载管理的方法。
背景技术
在一个大型集群系统中,电费占集群系统管理费用的很大一部分,因为传统的集群系统中所有的节点都处于开机状态,不管集群节点的利用率是不是满负荷,浪费了很多电费。
集群系统中大部分节点上有“电源管理模块”,如果能够根据作业负载情况自动的关闭/开启节点电源,能给集群管理者节省大量的人力、财力。当作业负载较轻时,自动关闭一部分空闲节点电源,达到节能的目的;当作业负载重时,自动开启一部分断电节点,来满足作业需求,基于此,现提供一种集群智能负载管理的方法。
发明内容
本发明的技术任务是解决现有技术的不足,提供一种集群智能负载管理的方法。
本发明的技术方案是按以下方式实现的,该一种集群智能负载管理的方法,包括以下步骤:
步骤一、配置文件中的配置项,该配置项包括:最大上电空闲节点数、节点空闲持续时间、一次关闭操作最多节点数、轮训时间;
步骤二、集群系统中节点与节点电源管理模块ip的对应关系文件,格式为:
节点名 节点的电源管理模块ip,在获取节点状态的时候通过读取该文件来获取电源管理模块的ip地址;
步骤三、启动轮训节点状态守护进程,该守护进程定时通过给节点电源模块发送节点电源状态查询命令,通过读取节点和节点电源管理模块ip文件来获取电源管理模块的ip,然后给该ip发送获取电源状态的命令,来获取节点电源状态,并存入文件,获取节点的电源状态;
步骤四、启动开关机决策守护进程,在固定时间间隔内,查询是否有排队作业、节点的空闲/忙状态、预留的节点、电源开启PowerOn和电源关闭PowerOff的节点数量,根据上面的查询结果和配置文件中的配置项值来确定开关机决策,其决策过程依据是满足集群系统中作业的需求,在满足作业需求的同时冗余一定数量的空闲节点处于上电状态,在前面的作业没有释放资源时,空闲节点来满足后续提交作业的需求;当空闲节点大于配置项最大上电空闲节点数时,就关闭一部分节点,达到节能的目的。
所述步骤三的详细过程为:启动轮训节点状态守护进程,在固定的间隔内执行,
a、通过节点电源管理模块命令获取节点的电源状态,返回节点PowerOn/PowerOff状态;
b、将节点电源状态保存到文件PowerState.txt。
进一步的,所述轮训节点状态守护进程的实现过程为:
步骤一、首先通过读取node-map.txt,获取一个节点的电源管理模块的ip;
步骤二、读取结束时,如果到了文件尾处,则等待轮训时间,并返回步骤一;
步骤三、读取未结束,则发送电源管理模块节点电源状态查询命令;
步骤四、将命令返回状态写入PowerState.txt,然后返回步骤一。
所述步骤四的详细过程为:启动开关机决策守护进程,在固定的间隔内执行,
a、开启节点电源,下面两种情况需要开启节点:
(1)有排队作业;根据排队作业需要的资源,从PowerOff节点中查找满足作业需求的节点并将其开启;
(2)实际空闲节点数量小于最大上电空闲节点数,开启节点个数=min((最大上电空闲节点数减实际空闲节点数量个节点数),(Poweroff节点数));
b、关闭节点电源,实际空闲节点数量大于最大上电空闲节点数,在关闭节点时需要满足两个条件:一个是关闭节点的空闲时间大于配置项节点空闲持续时间;另一个条件是一次关闭的空闲节点数量小于等于配置项一次关闭操作最多节点数,其中实际空闲节点数量=空闲节点数量–预留节点数量。
本发明与现有技术相比所产生的有益效果是:
本发明的一种集群智能负载管理的方法通过运行一个shell脚本或者C程序来完成集群系统中智能负载管理,根据作业负载的变化情况,自动开启/关闭集群中的部分节点,当作业负载轻时,通过电源管理模块关闭一些节点电源;当作业负载重时,通过电源管理模块开启一部分节点电源,帮助集群管理者节能;能够根据集群系统的作业和资源走势,自动开启、关闭集群中的节点电源;当作业负载较轻时,将大量空闲节点关闭;当作业负载重时,将断电的节点重新开启;因为电费在集群系统的管理费用中占很大比例,而使用该方法,可以给集群系统管理者节省大量的电费;实用性强,易于推广。
附图说明
附图1是本发明的轮训节点状态守护进程实现流程图。
附图2是本发明的开关机决策守护进程的实现流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310695452.1/2.html,转载请声明来源钻瓜专利网。