[发明专利]一种刀片服务器管理网络主动式检测方法有效
| 申请号: | 201310363663.5 | 申请日: | 2013-08-20 |
| 公开(公告)号: | CN103428033B | 公开(公告)日: | 2018-05-18 |
| 发明(设计)人: | 陈刚 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
| 主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;H04L29/08 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 250014 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 刀片 服务器管理 网络 主动 检测 方法 | ||
本文发明一种刀片服务器管理网络主动式检测方法,通过对刀片服务器关键部件增加自检机制,保证当服务器管理网络出现通信失效时具备主动处理能力。从管理模块和被管理模块两方面增加主动检测,并提供模块间的检测机制,大大提高了刀片服务器管理网络的强壮性和可用性,也促进了大规模服务器集群网络管理能力的提升。
技术领域
本发明涉及刀片服务器技术领域,具体地说是一种刀片服务器管理网络主动式检测方法。
背景技术
刀片服务器以其高计算密度、优化部署、资源共享和便于集中管理的特点被大量应用在高性能计算和云计算服务领域中,它已成为现今服务器发展的主要方向之一。刀片服务器系统通常可容纳几片至几十片计算刀片,多个电源模块及风扇模块、冗余备份管理模块、多个交换机模块。正是由于这种高密度性,具备高可用性的服务器监控管理网络就非常必要,特别是针对日益扩大的服务器集群规模,没有强壮的管理网络是不可想象的。
目前,刀片服务器的管理网络通常采用管理模块管理,此方式管理方便且集中,但集中的缺点就在于管理模块一旦出现问题,整个管理网络将无法正常运作,同时这种方法对被管理模块管理网络失效时的检测能力主动性明显不足。并且,对发生问题模块只能通过在线固件更新,或者通过停机后采用离线工具进行修改再后重新应用,这种方式不仅降低了工程实施和维护的效率,更严重影响用户的正常工作需求,特别是对于大规模服务器集群布置的网络中,一旦关键模块网络发生故障,很可能导致整个集群出现使用性问题。
因此,如何即弥补服能务器管理网络主动检测能力不足,又能提高管理网络可用性和强壮性,就成了亟需解决的问题。
发明内容
本发明的目的是提供一种刀片服务器管理网络主动式检测方法。
本发明的目的是按以下方式实现的,包括:1)刀片服务器各部件类型及连接方法;2)刀片服务器管理网络主动式自检机制;3)刀片服务器管理网络各模块自检方法,其中:
1)在刀片服务器各部件类型及连接方法中,所述部件类型包括:(1)刀片模块BMC单元;(2)主、备管理模块SMC单元;所述部件连接方式包括:(1)刀片模块的BMC、管理模块的SMC间通过LAN方式链接;(2)主、备管理模块的SMC间通过HeartBeat和SMBus方式链接;
2)刀片服务器管理网络主动式自检机制中,所述主动式,具体到管理模块不仅自身状态主动检测,也对被管理模块状态检测的主动查询;被管理模块自身状态主动检测;
3)刀片服务器管理网络各模块自检方法,主动式检测是对管理模块和被管理模块进行不同的自检激励、自检执行实施;其中:
管理模块自检激励包括:
1)在SMC端启动自检服务进程;
2)在SMC端通过LAN主动向BMC端发送主动查询检测指令;
3)在SMC端建立自身回环检测;
4)在主备SMC间建立基于心跳的检测机制;
管理模块自检执行实施包括:
1)SMC重启相应BMC;
2)SMC重启自身IPMI服务主进程;
3)状态异常的SMC会被对方重启,并进行备份状态;
被管理模块自检激励包括:
1)在BMC端启动自检服务进程
2)在BMC端通过LAN主动向SMC端回复查询检测指令;
3)在BMC端建立自身回环检测;
被管理模块自检执行实施包括:
1)BMC被SMC重启;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310363663.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:氧化亚铜表面包覆氧化铜的复合材料及其制备方法
- 下一篇:稻麦微型收割机





