[发明专利]一种适用于分布式任务管理系统的状态一致性维护方法有效
申请号: | 201410292893.1 | 申请日: | 2014-06-26 |
公开(公告)号: | CN104077181B | 公开(公告)日: | 2017-08-29 |
发明(设计)人: | 高原;卢建刚;顾文杰;任升;沙一川;曾坚永;赵瑞锋;方华建 | 申请(专利权)人: | 国电南瑞科技股份有限公司;广东电网有限责任公司电力调度控制中心 |
主分类号: | G06F9/46 | 分类号: | G06F9/46 |
代理公司: | 南京纵横知识产权代理有限公司32224 | 代理人: | 董建林,许婉静 |
地址: | 210061 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 分布式 任务 管理 系统 状态 一致性 维护 方法 | ||
1.一种适用于分布式任务管理系统的状态一致性维护方法,其特征在于:包括以下步骤,
步骤(1),分布式任务管理系统节点状态的维护,分布式任务管理系统的所有节点定期广播发送心跳报文,通知其他节点本机的生存状态;
步骤(2),分布式任务管理系统的任务初始化,在分布式任务管理系统的每个节点上运行任务管理程序,在任意一个节点上输入所有的待部署任务,任务管理程序根据活跃节点数量决定部署情况,并与分布式任务管理系统中所有节点进行通信,得到确认回复后,分布式任务管理系统到达一致的初始化状态;
步骤(3),分布式任务管理系统的任务状态改变,当分布式任务管理系统的任意一个节点上的任务运行状态发生改变时,任务管理程序都会与分布式任务管理系统中所有节点进行通信,得到确认回复后,每个节点同时实施改动,分布式任务管理系统进入另一个一致的状态;
步骤(4),节点故障和恢复的处理,当分布式任务管理系统中的一个节点故障退出或者恢复加入后,分布式任务管理系统的节点集合发生改变,分布式任务管理系统保持维持一致的状态,所述步骤(4)分布式任务管理系统出现一个故障节点,则总节点数减一,提案获得半数以上通过的数量阈值相应降低;故障恢复的节点首先向分布式任务管理系统中发出设置本机当前任务状态的提案请求,本机的任务由断网改变为在线的状态改变提案,其他节点收到后发现编号过旧,则会发出否定回复,并附加本机的任务状态信息,故障恢复的节点接收到否定回复,并选择最大编号的节点进行学习,更新本地任务状态后重新加入分布式任务管理系统运行,总的节点数加一,提案获得半数以上通过的数量阈值相应增加;
其中,步骤(1)所述分布式任务管理系统的所有节点定期广播发送的心跳报文包括节点名、节点编号、本机状态编号,当3秒的时间间隔后,分布式任务管理系统接收不到某个节点的心跳,判断该节点为故障,能正常收到心跳的节点判断为活跃节点,节点编号为节点的优先级,编号越小的优先级越大;
步骤(2)所述任务管理程序根据活跃节点数量决定部署情况的过程为,
(1)任务管理程序查看所有活跃的节点;
(2)将任务负载均衡的部署到每个活跃的节点上,并将部署计划通知到每个活跃节点。
2.根据权利要求1所述的一种适用于分布式任务管理系统的状态一致性维护方法,其特征在于:步骤(3)所述任务管理程序都会与分布式任务管理系统中所有节点进行通信,将需要进行的改变发出给所有节点,得到半数以上节点确认回复后,每个节点同时实施改动,分布式任务管理系统进入另一个一致的状态。
3.根据权利要求1所述的一种适用于分布式任务管理系统的状态一致性维护方法,其特征在于:步骤(3)分布式任务管理系统的每一次状态改变,都会在各节点心跳报文的本机状态编号的当前状态编号加1,各节点的初始化的本机状态编号为0。
4.根据权利要求1所述的一种适用于分布式任务管理系统的状态一致性维护方法,其特征在于:步骤(3)需要状态改变的节点将状态改变作为提案请求发出,并进行提案接收,发出提案请求时,当前状态编号加1,若接收的提案的状态编号大于本机的状态编号,则给出确认回复,否则,给出否定回复反对接收到的提案,需要状态改变的节点接收到半数以上的活跃节点确认回复后,表示此提案请求被批准,则该节点发送提交报文,让分布式任务管理系统所有活跃节点改变任务状态,所有活跃节点更新本机状态编号,并且回复完成给发送提交报文的节点。
5.根据权利要求1或4所述的一种适用于分布式任务管理系统的状态一致性维护方法,其特征在于:若接收到多个节点的提案请求,且每个提案请求的本机状态编号一致,则只确认回复节点编号最小的提案请求。
6.根据权利要求4所述的一种适用于分布式任务管理系统的状态一致性维护方法,其特征在于:所述接收者若接收的提案的状态编号比本地状态编号小或者等于本地编号,则说明提案发送者的状态比系统中全局的状态要旧,存在状态变化的提交报文丢失过,此时状态旧的节点需要从状态新的节点学习状态信息,提案接收者在给出否定回复时,顺带捎上本节点最新的任务状态信息。
7.根据权利要求4所述的一种适用于分布式任务管理系统的状态一致性维护方法,其特征在于:所述接收者若在接收到比本机状态编号大提案的状态编号后,又接收到一个编号更大的提案的状态编号,接收者给此更大编号的提案者发送确认回复时要捎带本节点需要先学习到最新状态的请求,发送者在给此接收者发出提交报文时捎带上一轮的状态,接收者学习完上一轮状态后,在本地提交状态改变。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国电南瑞科技股份有限公司;广东电网有限责任公司电力调度控制中心,未经国电南瑞科技股份有限公司;广东电网有限责任公司电力调度控制中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410292893.1/1.html,转载请声明来源钻瓜专利网。