[发明专利]用于分布式计算的主动故障恢复模型有效
| 申请号: | 201580052408.6 | 申请日: | 2015-07-20 |
| 公开(公告)号: | CN106796540B | 公开(公告)日: | 2021-01-05 |
| 发明(设计)人: | 哈兰德·S·AL-瓦哈比 | 申请(专利权)人: | 沙特阿拉伯石油公司 |
| 主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F11/20 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 杨姗 |
| 地址: | 沙特阿拉*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 分布式 计算 主动 故障 恢复 模型 | ||
1.一种计算机实现的方法,包括:
构建多个计算节点的虚拟树状计算结构,所述多个计算节点被映射为以父/子类型关系进行通信,其中针对所述计算节点中的每一个计算节点,一个或多个直接子代被指定为默认恢复节点,并且另一节点被指定为检查点节点;
针对所述虚拟树状计算结构的每个计算节点,由硬件处理器执行节点故障预测模型以计算与所述计算节点相关联的平均故障间隔时间“MTBF”;
基于计算出的MTBF与最大和最小阈值之间的比较来确定执行第一计算节点的检查点;
将过程从所述第一计算节点迁移至针对所述第一计算节点指定的默认恢复节点;以及
在针对所述第一计算节点指定的所述默认恢复节点上继续执行所述过程。
2.根据权利要求1所述的方法,还包括:
针对每个计算节点收集至少计算能力参数和节点位置参数;
基于所述计算节点的节点位置参数将所述计算节点划分为集合;以及
基于所述计算能力参数对每个集合内的节点进行排序。
3.根据权利要求2所述的方法,还包括:
识别上限和下限以确定经排序的计算节点的等级;
基于所述计算能力参数以及所述上限和所述下限将每个集合内的计算节点排序为水平等级;
将所述水平等级布置和垂直布置记录到与每个计算节点相关联的相应节点记录信息表中,其中所述垂直布置是至少基于每个计算节点的节点位置参数确定的;以及
用所指定的默认恢复节点填充每个节点记录信息表。
4.根据权利要求3所述的方法,其中,所述上限和所述下限是根据针对每个计算节点所收集的计算能力参数和节点位置参数的交绘图确定的。
5.根据权利要求1所述的方法,其中,所述MTBF是至少基于网络或数据存储故障计算的。
6.根据权利要求1所述的方法,还包括:
当所述第一计算节点的MTBF小于所述最小阈值时创建检查点;以及
将与所述第一计算节点相关联的所述最小阈值更新为等于所述MTBF。
7.根据权利要求6所述的方法,还包括:
确定所述第一计算节点的故障已经发生;以及
使用针对所述第一计算节点采取的最后一个检查点作为过程状态。
8.一种非瞬时性计算机可读介质,存储计算机可读指令,所述指令能够由计算机执行以执行包括以下各项的操作:
构建多个计算节点的虚拟树状计算结构,所述多个计算节点被映射为以父/子类型关系进行通信,其中针对所述计算节点中的每一个计算节点,一个或多个直接子代被指定为默认恢复节点,并且另一节点被指定为检查点节点;
针对所述虚拟树状计算结构的每个计算节点,执行节点故障预测模型以计算与所述计算节点相关联的平均故障间隔时间“MTBF”;
基于计算出的MTBF与最大和最小阈值之间的比较来确定执行第一计算节点的检查点;
将过程从所述第一计算节点迁移至针对所述第一计算节点指定的默认恢复节点;以及
在针对所述第一计算节点指定的所述默认恢复节点上继续执行所述过程。
9.根据权利要求8所述的介质,所述操作还包括:
针对每个计算节点收集至少计算能力参数和节点位置参数;
基于所述计算节点的节点位置参数将所述计算节点划分为集合;以及
基于所述计算能力参数对每个集合内的节点进行排序。
10.根据权利要求9所述的介质,所述操作还包括:
识别上限和下限以确定经排序的计算节点的等级;
基于所述计算能力参数以及所述上限和所述下限将每个集合内的计算节点排序为水平等级;
将所述水平等级布置和垂直布置记录到与每个计算节点相关联的节点记录信息表中,其中所述垂直布置是至少基于每个计算节点的节点位置参数确定的;以及
用所指定的默认恢复节点填充每个节点记录信息表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沙特阿拉伯石油公司,未经沙特阿拉伯石油公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580052408.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:安全关键的机动车系统的微控制器系统和方法及其应用
- 下一篇:合并存储操作





