[发明专利]服务器电源防护方法在审
申请号: | 201910762406.6 | 申请日: | 2019-08-19 |
公开(公告)号: | CN110794943A | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 余文杰;张倬;王兆丽;施小辉;孙妍 | 申请(专利权)人: | 联想企业解决方案(新加坡)有限公司 |
主分类号: | G06F1/26 | 分类号: | G06F1/26;G06F1/28;H04B3/54 |
代理公司: | 44503 深圳尚业知识产权代理事务所(普通合伙) | 代理人: | 文蓉 |
地址: | 新加坡*** | 国省代码: | 新加坡;SG |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 防护控制器 电源模块 电源 防护 指令 电力线通信 发出指令 关闭电源 可通信 服务器 | ||
本发明公开了服务器(102,104)包括两个电源模块(114,116,128,130),电源模块包括彼此有数据可通信关系的电源(138,142)和防护控制器(120,122),防护控制器适于经由电力线通信(PLC)接收和/或发出防护指令,并且在接收到防护指令时,防护控制器适于向电源发出指令以关闭电源。
技术领域
本发明涉及服务器电源防护方法,以及适合(但不限于)用于执行这种方法的电源模块和服务器。
背景技术
在其中许多节点(服务器)可能正在处理若干重要生产数据的高可用集群中,可能发生“裂脑”。一般而言,“裂脑”是指源自维持具有重叠范围的两个单独数据集的数据或可用性不一致的问题,例如,由于服务器无法通信并且彼此同步其数据。可以通过建立“防护”策略来减轻由错误的集群节点(服务器)引起的这种问题。“防护”是将节点(服务器)隔离或保护共享资源(例如共享磁盘)与群集内的故障节点隔离的过程。
广泛地说,有两种防护方法:资源防护和节点防护,它们都在图1中示出。资源防护方法不允许故障节点(服务器)访问共享资源而不关闭节点。这可能包括:
-持久保留防护,它使用SCSI3持久保留来阻止对共享资源的访问,
-光纤信道防护,其禁用光纤信道端口,和
-全局网络块设备(GNBD)防护,其禁用对GNBD服务器的访问。
作为示例,图1示出了在具有五个节点(A到E)的集群中,节点A中的电源防护代理可以运行防护程序,来控制光纤信道交换机,以禁用光纤信道交换机中的光纤信道端口,以便不允许故障节点(例如节点C)访问共享存储器。
节点防护方法也称为“STONITH”,其代表“射击另一个节点的头部”,意味着怀疑节点被禁用或关闭。具有通过STONITH的节点防护的集群可以配置有许多支持防护设备,包括:
-不间断电源(UPS);
-PDU(配电单元);
-进刀电源控制设备;
-无人值守设备(例如Lenovo XCC/IMM、HP iLO、Dell DRAC)。
例如,再次如图1所示,具有五个节点(A到E)的集群包括功率控制器,该功率控制器可以被操作以关闭故障节点(例如节点C)。
已知这种现有的防护布置具有以下缺点:
(a)如果节点宣布彼此故障并相互重新启动,则可能发生相互防护困境。无人值守设备和其他电源防护设备无法完全避免这种困境。
(b)外部防护设备(例如UPS或PDU)通常很昂贵。
(c)所有当前的STONITH设备都需要额外的网络连接(以太网或串行总线)来发送防护指令。如果该网络出现故障,则无法防止群集出现裂脑现象。
(d)防护设备和网络的配置可能相对复杂。
(e)防护的替代方案(例如仲裁或SCSI保留)至少需要一个额外的节点或更多的外部依赖。
具体参考共同防护或“相互防护”,并且以具有两个服务器(即主机A和主机B)的群集为例,并且参考图2,这在主机A的操作软件(OS)发送用于防护主机B的“关闭B”指令时发生。这个“关闭B”指令由主机B的基板管理控制器(BMC)接收,该控制器作用于指令并关闭电源。但是,在关闭主机B之前,主机B的操作软件(OS)发送“关闭A”指令,用于防护主机A。主机A的基板管理控制器(BMC)收到此“关闭A”指令,并对其采取行动让关闭其自身。因此,主机A和主机B都关闭,两者都被防护,这导致网络故障,需要人为干预。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想企业解决方案(新加坡)有限公司,未经联想企业解决方案(新加坡)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910762406.6/2.html,转载请声明来源钻瓜专利网。