[发明专利]一种网关设备故障处理方法及装置有效
申请号: | 201510827711.0 | 申请日: | 2015-11-24 |
公开(公告)号: | CN106789141B | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 曾文秋 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网关 设备 故障 处理 方法 装置 | ||
1.一种网关设备故障处理方法,其特征在于,包括:
当检测到网关设备发生故障时,获取发生故障的网关设备当前正在执行的计算任务;
根据下发所述计算任务时的参数筛选待分配计算任务,所述参数用于指示所述计算任务是否需要进行失效转移Failover处理;
结束发生故障的网关设备当前正在运行的计算任务,并根据预设的调度策略将所述待分配计算任务调度至当前状态为正常的其他网关设备;
恢复所述待分配计算任务的任务状态,并通过所述其他网关设备执行所述待分配计算任务;其中,当检测到网关设备发生故障时,获取发生故障的网关设备正在执行的计算任务,具体为:
对当前各网关设备在启动时注册的临时文件进行检测;
当有临时文件被删除时,将与被删除临时文件对应的网关设备作为所述网关设备,并获取所述网关设备当前正在执行的计算任务;
其中,根据下发所述计算任务时的参数筛选待分配计算任务,具体为:
确定所述参数的Failover处理取值是否为有效状态;
若所述Failover处理取值为有效状态,将所述计算任务作为所述待分配计算任务置于优先级最高的队列;
若所述Failover处理取值为无效状态,将所述计算任务置错;
其中,所述恢复所述待分配计算任务的任务状态,并通过所述其他网关设备执行所述待分配计算任务的过程可以通过其他网关设备之间的指示信令实现,也可由网关设备自发运行。
2.如权利要求1所述的方法,其特征在于,结束发生故障的网关设备当前正在运行的计算任务,具体为:
若所述网关设备当前的故障类型为断网,遍历所述网关设备当前所有的进程,并结束所述网关设备的长驻进程;
若所述网关设备当前的故障类型为进程崩溃,将所述网关设备启动的长驻进程结束。
3.如权利要求1所述的方法,其特征在于,在通过所述其他网关设备执行所述待分配计算任务之后,还包括:
查询所述待分配计算任务的任务状态,以及所述待分配计算任务是否在所述其他网关设备运行;
若所述待分配计算任务处于运行状态,获取所述待分配计算任务的任务状态和计算任务日志;
若所述待分配计算任务运行失败,重新提交所述待分配计算任务,并获取所述待分配计算任务的任务状态和计算任务日志;
若所述待分配计算任务已运行结束,提交在所述待分配计算任务之后的其他计算任务,并获取所述其他计算任务的任务状态和计算任务日志。
4.一种网关设备故障处理装置,其特征在于,包括:
获取模块,当检测到网关设备发生故障时,获取发生故障的网关设备当前正在执行的计算任务;
筛选模块,根据下发所述计算任务时的参数筛选待分配计算任务,所述参数用于指示所述计算任务是否需要进行Failover处理;
结束模块,结束发生故障的网关设备当前正在运行的计算任务,并根据预设的调度策略将所述待分配计算任务调度至当前状态为正常的其他网关设备;
恢复模块,恢复所述待分配计算任务的任务状态,并通过所述其他网关设备执行所述待分配计算任务;其中所述获取模块具体用于:
对当前各网关设备在启动时注册的临时文件进行检测;
当有临时文件被删除时,将与被删除临时文件对应的网关设备作为所述网关设备,并获取所述网关设备当前正在执行的计算任务;
其中,所述筛选模块具体用于:
确定所述参数的Failover处理取值是否为有效状态;
若所述Failover处理取值为有效状态,将所述计算任务作为所述待分配计算任务置于优先级最高的队列;
若所述Failover处理取值为无效状态,将所述计算任务置错;
其中,所述恢复所述待分配计算任务的任务状态,并通过所述其他网关设备执行所述待分配计算任务的过程可以通过其他网关设备之间的指示信令实现,也可由网关设备自发运行。
5.如权利要求4所述的装置,其特征在于,所述结束模块具体用于:
若所述网关设备当前的故障类型为断网,遍历所述网关设备当前所有的进程,并结束所述网关设备的长驻进程;
若所述网关设备当前的故障类型为进程崩溃,将所述网关设备启动的长驻进程结束。
6.如权利要求4 所述的装置 ,其特征在于,还包括:
查询模块,查询所述待分配计算任务的任务状态,以及所述待分配计算任务是否在所述其他网关设备运行;
若所述待分配计算任务处于运行状态,所述查询模块获取所述待分配计算任务的任务状态和计算任务日志;
若所述待分配计算任务运行失败,所述查询模块重新提交所述待分配计算任务,并获取所述待分配计算任务的任务状态和计算任务日志;
若所述待分配计算任务已运行结束,所述查询模块提交在所述待分配计算任务之后的其他计算任务,并获取所述其他计算任务的任务状态和计算任务日志。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510827711.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:具有散热石墨片的笔记本电脑底座
- 下一篇:一种散热效率高的弧形散热机箱