[发明专利]一种CC-NUMA多节点服务器上系统状态切换和监控的方法在审
申请号: | 201410831246.3 | 申请日: | 2014-12-29 |
公开(公告)号: | CN104506362A | 公开(公告)日: | 2015-04-08 |
发明(设计)人: | 贡维;宗艳艳 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L1/22 |
代理公司: | 济南信达专利事务所有限公司37100 | 代理人: | 姜明 |
地址: | 250101山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 cc numa 节点 服务器 系统 状态 切换 监控 方法 | ||
技术领域
本发明公开一种系统状态切换和监控的方法,属于服务器管理领域,具体地说是一种CC-NUMA多节点服务器上系统状态切换和监控的方法。
背景技术
高端服务器通常应用于OLTP 联机事务处理能力要求非常高的场景,如银行、科学计算等,由于在同一时间计算和存储的数据量非常大,高端服务器一般采用CC-NUMA的体系结构设计。CC-NUMA ,Cache Coherent-Non Uniform Memory Access Architecture,即Cache一致性非统一内存访问,将多个处理器通过专门的互连设备连接在一起组成分布式和共享内存空间,只运行一个操作系统。每一个处理器可以访问自己的Memory存储器,也可以访问其他处理器或者共享的存储器,多个处理器之间一般采用背板或光纤的方式连接,所以在形态上就是由多个服务器节点互连形成一个分区,运行一个操作系统。传统CC-NUMA架构的多节点服务器系统中,其各个节点一般都是自己独立控制开机、关机和重启操作,在操作上每个服务器节点是单独控制,各个节点之间缺乏统一的时序控制和系统监控,控制不当时容易导致系统无法正常启动,影响服务器的工作效率。本发明提供一种CC-NUMA多节点服务器上系统状态切换和监控的方法,通过所有的系统状态切换操作都由主节点服务器发起、从节点服务器跟随执行,并且整个流程都可被BMC管理单元监控,实现同步开机、关机、热重启、冷重启的方法,以解决多节点服务器之前缺少统一时序控制的问题,并且整个状态变化过程都可以被BMC监控记录。
发明内容
本发明针对传统CC-NUMA架构的多节点服务器系统中,其各个节点一般都是自己独立控制开机、关机和重启操作,在操作上每个服务器节点是单独控制,各个节点之间缺乏统一的时序控制和系统监控,控制不当时容易导致系统无法正常启动,影响服务器的工作效率的问题,提供一种CC-NUMA多节点服务器上系统状态切换和监控的方法,实现同步开机、关机、热重启、冷重启,以解决多节点服务器之前缺少统一时序控制的问题,并且整个状态变化过程都可以被BMC监控记录。
提出的具体方案是:
一种CC-NUMA多节点服务器上系统状态切换和监控系统,包括主节点服务器,从节点服务器,主节点服务器和从节点服务器内都设有BMC监控管理单元,客户端主机;
主节点服务器:主节点服务器负责整个计算机地址空间的分配,其运行BIOS和OS,也是系统状态切换的发起者;
若干个从节点服务器:从节点服务器提供计算扩展功能,也是系统状态切换跟随执行者;
主节点和从节点服务器内的BMC监控管理单元:BMC通过“内部管理网络”负责节点服务器之间的通信;
客户端主机:主节点服务器中的BMC还通过一个外部管理网络接口连接到客户端主机,系统状态切换的操作在客户端主机可被监控。
一种CC-NUMA多节点服务器上系统状态切换和监控的方法,利用权利要求1所述的一种CC-NUMA多节点服务器上系统状态切换和监控系统,主节点服务器调节发送Power_Enable、Power_OK、System_Reset三种信号通知内部BMC需要执行的操作,由内部管理网络接口通知从节点内的BMC,从节点内的BMC接到命令后去执行相应的系统状态操作,此外主节点服务器中的BMC根据从节点内接收的Power_Enable、Power_OK和System_Reset的不同电平组合和脉冲信号来判断系统当前的状态,通知客户端主机以便监控。
所述的系统状态切换是指开机、关机、冷重启、热重启。
所述的系统状态切换为开机,具体步骤为:
①主节点服务器发出高电平“Power_Enable”有效信号给BMC,通知BMC需要执行上电操作;
②主节点服务器中的BMC将开机命令通过内部管理网络接口传递给从节点服务器的BMC;
③从节点服务器的BMC发出高电平“Power_Enable”给所有的从节点服务器,通知从节点服务器执行开机操作;
④主节点和从节点服务器执行开机操作后,反馈高电平“Power_OK”信号给各自的BMC,预示本节点上电完成;
⑤在“Power_OK”之后,主节点服务器发出高电平“System_Reset”给BMC,预示主节点内处理器、内存、芯片组复位完成,等待从节点复位完成;
⑥主节点服务器中的BMC收到“System_Reset”后,通过内部管理网络通知其他从节点的BMC;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司;,未经浪潮电子信息产业股份有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410831246.3/2.html,转载请声明来源钻瓜专利网。