[发明专利]一种适用于分布式任务管理系统的状态一致性维护方法有效
申请号: | 201410292893.1 | 申请日: | 2014-06-26 |
公开(公告)号: | CN104077181B | 公开(公告)日: | 2017-08-29 |
发明(设计)人: | 高原;卢建刚;顾文杰;任升;沙一川;曾坚永;赵瑞锋;方华建 | 申请(专利权)人: | 国电南瑞科技股份有限公司;广东电网有限责任公司电力调度控制中心 |
主分类号: | G06F9/46 | 分类号: | G06F9/46 |
代理公司: | 南京纵横知识产权代理有限公司32224 | 代理人: | 董建林,许婉静 |
地址: | 210061 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 分布式 任务 管理 系统 状态 一致性 维护 方法 | ||
技术领域
本发明涉及一种适用于分布式任务管理系统的状态一致性维护方法,属于分布式处理技术领域。
背景技术
在分布式处理系统中,每个节点处理全局任务的子集,但一般需要协同工作和进行状态同步,在所有节点处理完成后汇总结果,再进行下一轮处理,系统运行过程中随时可能改变任务的运行状态,如需要在某几个节点增加一些任务、需要进行任务负载均衡的调整或者某个节点的任务发生故障等,系统中每个节点都必须准确及时的知道其他节点的存在和运行了哪些子任务,否则可能会出现任务遗漏、任务重复、任务迟延等情况,从而如何保证分布式任务系统在全局范围内的运行状态一致性是保证分布式任务系统正常运行的关键点。
现有的分布式管理系统解决上述问题一般有如下三种方法,但分别存在不同的缺点,具体如下,
(1)人工配置和干预法,分布式管理系统初始是由人工配置好节点上运行的任务,当节点故障或恢复时再人工调整任务部署的情况,或者是正常运行时人工的调整任务部署,其的缺陷是不够灵活,系统的维护成本高。
(2)全局协调器法,分布式管理系统中有一个全局管理节点,其上运行管理程序对系统的运行状态进行监视,系统的状态变换都有此节点发出指令,这种方法可以保证系统在同一时刻只执行一条指令,其的缺陷是全局协调器成为系统的单点故障瓶颈。
(3)定期同步法,分布式管理系统的每个节点定期向系统中广播自己的状态,此方法缺陷是通信量大,且各个节点只能知晓其他节点的运行状态,但是对故障的处理还是各自执行,很容易在广播报文丢失或延迟的情况下产生不一致性。
总之,上述的状态一致性管理方法在有可能出现的节点故障和网络通信故障条件下都有不完善的地方。
发明内容
本发明的目的是克服现有的分布式任务管理系统的状态一致性维护方法,不够灵活、维护成本高、同一时刻只执行一条指令、通信量大时广播报文容易丢失或延迟的问题。本发明的适用于分布式任务管理系统的状态一致性维护方法,自动化程度高、可靠性高、通信效率高、占用带宽小、可移植性好,具有良好的应用前景。
为了达到上述目的,本发明所采用的技术方案是:
一种适用于分布式任务管理系统的状态一致性维护方法,其特征在于:包括以下步骤,
步骤(1),分布式任务管理系统统节点状态的维护,分布式任务管理系统的所有节点定期广播发送心跳报文,通知其他节点本机的生存状态;
步骤(2),分布式任务管理系统的任务初始化,在分布式任务管理系统的每个节点上运行任务管理程序,在任意一个节点上输入所有的待部署任务,任务管理程序根据活跃节点数量决定部署情况,并与分布式任务管理系统中所有节点进行通信,得到确认回复后,分布式任务管理系统到达一致的初始化状态;
步骤(3),分布式任务管理系统的任务状态改变,当分布式任务管理系统的任意一个节点上的任务运行状态发生改变时,任务管理程序都会与分布式任务管理系统中所有节点进行通信,得到确认回复后,每个节点同时实施改动,分布式任务管理系统进入另一个一致的状态;
步骤(4),节点故障和恢复的处理,当分布式任务管理系统中的一个节点故障退出或者恢复加入后,分布式任务管理系统的节点集合发生改变,分布式任务管理系统保持维持一致的状态。
前述的一种适用于分布式任务管理系统的状态一致性维护方法,其特征在于:步骤(1)所述分布式任务管理系统的所有节点定期广播发送的心跳报文包括节点名、节点编号、本机状态编号,当3秒的时间间隔后,分布式任务管理系统接收不到某个节点的心跳,判断该节点为故障,能正常收到心跳的节点判断为活跃节点,节点编号为节点的优先级,编号越小的优先级越大。
前述的一种适用于分布式任务管理系统的状态一致性维护方法,其特征在于:步骤(2)所述任务管理程序根据活跃节点数量决定部署情况的过程为,
(1)任务管理程序查看所有活跃的节点;
(2)将任务负载均衡的部署到每个活跃的节点上,并将部署计划通知到每个活跃节点。
前述的一种适用于分布式任务管理系统的状态一致性维护方法,其特征在于:步骤(3)所述任务管理程序都会与分布式任务管理系统中所有节点进行通信,将需要进行的改变发出给所有节点,得到半数以上节点确认回复后,每个节点同时实施改动,分布式任务管理系统进入另一个一致的状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国电南瑞科技股份有限公司;广东电网有限责任公司电力调度控制中心,未经国电南瑞科技股份有限公司;广东电网有限责任公司电力调度控制中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410292893.1/2.html,转载请声明来源钻瓜专利网。