[发明专利]一种高端容错计算机管理系统及方法在审
申请号: | 201410309564.3 | 申请日: | 2014-07-01 |
公开(公告)号: | CN104035831A | 公开(公告)日: | 2014-09-10 |
发明(设计)人: | 贡维;吴孝磊 | 申请(专利权)人: | 浪潮(北京)电子信息产业有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F11/30 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 王丹;李丹 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 高端 容错 计算机 管理 系统 方法 | ||
技术领域
本发明涉及计算机领域,具体地说是一种高端服务器系统管理方案。
背景技术
目前,高端容错计算机以强大的即时计算能力和高可靠等RAS特性被广泛应用于高性能计算、银行等关键领域。高端服务器系统复杂,一般包括计算节点、互连节点、IO扩展节点、存储节点等多种节点形态。如何对整个系统进行有效的管理,以及如何提高系统的供电和散热的效率,是高端服务器面临的一大技术难题。传统服务器一般采用BMC(Baseboard Management Controller,基板管理控制器)管理方案,所有管理功能集中于BMC,如系统电源、风扇、温度等的监控。当BMC出现故障时整个管理功能就意味着失效;同时传统服务器的供电和散热都是各自负责各自的部分,没有一个统一调度的机制,使得供电和散热资源不能充分利用。
发明内容
本发明所要解决的技术问题是,提供一种高端容错计算机管理系统及方法,解决高端服务器系统管理复杂的问题。
为了解决上述技术问题,本发明公开了一种高端容错计算机管理系统,包括系统电源和风扇,还包括交换机、多个计算节点以及与所有的系统电源和风扇均相连的系统管理控制器(SMC),其中:
所述SMC,通过所述交换机接收各个计算节点上报的采集信息,当计算节点上报的采集信息满足预先设定的计算节点管理策略,则通过所述交换机向该计算节点发送对应的管理操作指令,以及当计算节点上报的采集信息满足预先设定的系统供电、温度管理策略,则对所述系统电源和/或风扇进行对应的管理操作;
所述计算节点,通过交换机上报本计算节点的采集信息到所述SMC,以及在收到交换机发送的管理操作指令时,按照该指令对本计算节点进行对应的管理操作。
可选地,上述系统中,所述计算节点包括基板管理控制器(BMC)和复杂可编程逻辑器件(CPLD),其中:
所述BMC,获取本计算节点的采集信息,并通过所述交换机接上报给所述SMC,以及通过所述交换机接收管理操作指令,将该管理操作指令下发给所述CPLD;
所述CPLD,根据所述BMC下发的管理操作指令对本计算节点进行对应的管理操作。
可选地,上述系统中,述计算节点上报的采集信息至少包括如下一种或几种:
计算节点内的温度、计算节点内的电压、关键寄存储器信息。
可选地,上述系统中,所述计算节点的管理操作包括计算节点的开机、关机、复位操作。
可选地,上述系统中,所述系统电源的管理操作包括:增加系统电源数目、减少系统电源数目、读取系统电源的功耗、输出电压、电流、温度。
可选地,上述系统中,所述系统风扇的管理操作包括:提高风扇转速、降低风扇转速。
可选地,上述系统中,所述SMC包括两个SMC芯片,所述两个SMC芯片均与所述交换机相连,所述两个SMC芯片均与所有系统电源和风扇相连,两个SMC芯片之间通过冗余的互连总线连接;
所述两个SMC芯片之中,一个SMC芯片为主SMC,处于正常工作模式,另一个SMC芯片为从SMC,处于待命模式,其中:
所述从SMC通过心跳实时检测主SMC的状态,若检测到所述主SMC发生故障,则所述从SMC激活为正常工作模式以替换主SMC。
本发明还公开了一种高端容错计算机管理方法,包括:
如上述所述的高端容错计算机管理系统中系统管理控制器(SMC),通过所述交换机接收各个计算节点上报的采集信息,当计算节点上报的采集信息满足预先设定的计算节点管理策略时,所述SMC通过所述交换机向该计算节点发送对应的管理操作指令,该计算节点按照收到的管理操作指令对本计算节点进行对应的管理操作;
当计算节点上报的采集信息满足预先设定的系统供电、温度管理策略时,所述SMC对所述系统电源和/或风扇进行对应的管理操作。
可选地,上述方法中,所述计算节点上报的采集信息至少包括如下一种或几种:
计算节点内的温度、计算节点内的电压、关键寄存储器信息。
可选地,上述方法中,所述计算节点按照收到的管理操作指令对本计算节点进行对应的管理操作指:
所述计算节点按照管理操作指令对本计算节点进行开机、关机或复位操作。
可选地,上述方法中,所述SMC对所述系统电源进行对应的管理操作指:
所述SMC增加系统电源数目、减少系统电源数目、读取系统电源的功耗、输出电压、电流、温度。
可选地,上述方法中,所述SMC对所述风扇进行对应的管理操作指:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮(北京)电子信息产业有限公司,未经浪潮(北京)电子信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410309564.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:全玻璃真空太阳集热管口部外翻法兰生产模具
- 下一篇:窑炉格子体疏通装置