[发明专利]集群节点的侦测与管理系统在审
申请号: | 201811608659.X | 申请日: | 2018-12-27 |
公开(公告)号: | CN109885447A | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 马金山 | 申请(专利权)人: | 曙光信息产业(北京)有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30 |
代理公司: | 北京德恒律治知识产权代理有限公司 11409 | 代理人: | 章社杲;卢军峰 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 刀箱 交换机 管理模块 交换模块 公网 计算节点 侦测 管理系统 集群节点 节点管理 控制器 控制状态信息 交换机连接 节点位置 快速寻找 运行状态 集群 传输 管理 | ||
本发明公开了一种集群节点的侦测与管理系统,包括:连接于计算节点的刀箱管理模块、连接于刀箱管理模块的刀箱交换模块、连接于刀箱交换模块的刀箱交换机、连接于刀箱交换机和公网的交换机、以及通过交换机连接至公网的节点管理控制器,其中,计算节点、刀箱管理模块、刀箱交换模块和刀箱交换机都位于刀箱内部;其中,计算节点的状态信息依次经由刀箱管理模块、刀箱交换模块、刀箱交换机和交换机传输至公网,节点管理控制器通过公网获取和控制状态信息。通过上述技术方案,能够快速寻找问题所在节点位置,并侦测和管理整个集群所有节点的运行状态。
技术领域
本发明涉及服务器技术领域,具体来说,涉及一种集群节点的侦测与管理系统。
背景技术
随着信息化社会的飞速发展,人类对信息处理能力的要求越来越高,不仅石油勘探、气象预报、航天国防、科学研究等领域需求高性能计算机,而且金融、政府信息化、教育、企业、网络游戏等更广泛的领域对高性能计算的需求迅猛增长,这导致超算中心集群规模也越来越庞大,进而节点数量也在成倍的增加,这不仅给研发和调试人员对节点的状态监控与管理带来了巨大的困扰,也给后续运维人员带了更大的挑战。目前的现有技术只能小规模、或者只能对刀箱内部节点做管控,无法进行大规模节点的统一管理。
由于目前的超算中心只能对刀箱内部节点进行管控,无法进行大规模节点的统一管理,并且随着集群规模越来越庞大,进而节点数量也在成倍的增加,这不仅给研发和调试人员对节点的状态监控与管理带来了巨大的困扰,也给后续运维人员带了更大的挑战。因此,亟需一种对整个超算中心的所有节点进行统一管理的方法。
发明内容
针对相关技术中的上述问题,本发明提出一种集群节点的侦测与管理系统,能够快速寻找问题所在节点位置,并侦测和管理整个集群所有节点的运行状态。
本发明的技术方案是这样实现的:
根据本发明的一个方面,提供了一种集群节点的侦测与管理系统,包括:连接于计算节点的刀箱管理模块、连接于刀箱管理模块的刀箱交换模块、连接于刀箱交换模块的刀箱交换机、连接于刀箱交换机和公网的交换机、以及通过交换机连接至公网的节点管理控制器,其中,计算节点、刀箱管理模块、刀箱交换模块和刀箱交换机都位于刀箱内部;
其中,计算节点的状态信息依次经由刀箱管理模块、刀箱交换模块、刀箱交换机和交换机传输至公网,节点管理控制器通过公网获取和控制状态信息。
根据本发明的实施例,计算节点还连接于刀箱交换模块;其中,计算节点的第一状态下的状态信息依次经由刀箱交换模块、刀箱交换机和交换机传输至公网,节点管理控制器通过公网获取和控制第一状态下的状态信息。
根据本发明的实施例,计算节点与刀箱管理模块通过智能平台管理接口连接。
根据本发明的实施例,节点管理控制器采用主备冗余设计。
根据本发明的实施例,集群节点的侦测与管理系统还包括:用户端,用于通过公网访问节点管理控制器,以侦测集群的状态和管理集群。
根据本发明的实施例,状态信息包括:刀片节点的开关机状态、开关机控制信息、FRU信息、节点功耗、节点健康状态、日志信息和传感器信息之中的任意一种或多种。
本发明通过上述技术方案,为开发提供了有力的侦测控制手段,可以实时发现问题并快速定位问题节点,提高了开发效率;为部署与运维提供了极大帮助,可以快速寻找问题所在的节点位置,可以侦测整个集群的运行状态;减少了大量的人力物力成本,在大规模集群环境下提高了产品的可靠性以及可维护性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曙光信息产业(北京)有限公司,未经曙光信息产业(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811608659.X/2.html,转载请声明来源钻瓜专利网。