[发明专利]一种基于超算的横向扩展实现方法及系统在审
申请号: | 202111639187.6 | 申请日: | 2021-12-29 |
公开(公告)号: | CN114461569A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 涂阳;韩昊;李国庆;樊悦强 | 申请(专利权)人: | 济南超级计算技术研究院 |
主分类号: | G06F15/16 | 分类号: | G06F15/16 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 闫伟姣 |
地址: | 250215 山东省济南市中国(山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 横向 扩展 实现 方法 系统 | ||
本发明属于计算机领域,提供了一种基于超算的横向扩展实现方法及系统。该方法包括,同一局域网内的超算集群服务器、监控集群服务器和信息汇总服务器,根据新增超算集群服务器的指令,将新增超算集群服务器注册在监控集群中;监控集群根据所有的超算集群服务器重新规划每台监控服务器所需要监控的超算集群服务器数量;信息汇总服务器根据规划后每台监控服务器所需要监控的超算集群服务器数量,获取新增的监控服务器的超算集群服务器状态信息。
技术领域
本发明属于计算机领域,尤其涉及一种基于超算的横向扩展实现方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
随着高性能计算技术的发展,超算集群的稳定性已成为超算日常运行中的一个十分重要的组成部分,同时由于超算集群的复杂性以及超算规模的扩大,这给超算的稳定运行带来了许多不确定因素。当超算集群的规模越来越大时,如何监控整个超算系统的状态,如何保证监控质量,成为了一个关键的问题。
目前较为常见的解决方案,是将服务器的状态信息定时推送到指定服务器上存储,然后由指定服务器的信息进行可视化展示。这种方案的局限性在于,随着超算集群的规模越来越大,超算集群监控的可扩展性将越来越差,这就容易造成超算集群监控系统本身的时效性不准确,其监控系统本身的状态就会越来越不稳定。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供一种基于超算的横向扩展实现方法及系统,其在不增加运维成本的前提下,设计出合理的监控方案。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供一种基于超算的横向扩展实现方法。
一种基于超算的横向扩展实现方法,包括:同一局域网内的超算集群服务器、监控集群服务器和信息汇总服务器,
根据新增超算集群服务器的指令,将新增超算集群服务器注册在监控集群中;
监控集群根据所有的超算集群服务器重新规划每台监控服务器所需要监控的超算集群服务器数量;
信息汇总服务器根据规划后每台监控服务器所需要监控的超算集群服务器数量,获取新增的监控服务器的超算集群服务器状态信息。
本发明的第二个方面提供一种基于超算的横向扩展实现系统。
一种基于超算的横向扩展实现系统,包括:同一局域网内的超算集群服务器、监控集群服务器和信息汇总服务器,其中:
监控集群服务器根据新增超算集群服务器的指令,将新增超算集群服务器注册在监控集群中;监控集群根据所有的超算集群服务器重新规划每台监控服务器所需要监控的超算集群服务器数量;
信息汇总服务器,根据规划后每台监控服务器所需要监控的超算集群服务器数量,获取新增的监控服务器的超算集群服务器状态信息。
本发明的第三个方面提供一种基于超算的横向扩展实现方法。
一种基于超算的横向扩展实现方法,包括:同一局域网内的超算集群服务器、监控集群服务器和信息汇总服务器,
根据新增监控集群服务器的指令,将新增监控集群服务器注册在监控集群中;
监控集群根据所有的监控集群服务器重新规划每台监控服务器所需要监控的超算集群服务器数量;
信息汇总服务器根据规划后每台监控服务器所需要监控的超算集群服务器数量,获取新增的监控服务器的超算集群服务器状态信息。
本发明的第四个方面提供一种基于超算的横向扩展实现系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南超级计算技术研究院,未经济南超级计算技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111639187.6/2.html,转载请声明来源钻瓜专利网。