[发明专利]一种云计算平台故障检测方法、装置及解决方法、装置在审
申请号: | 201210370060.3 | 申请日: | 2012-09-27 |
公开(公告)号: | CN103701627A | 公开(公告)日: | 2014-04-02 |
发明(设计)人: | 刘宇航 | 申请(专利权)人: | 北京搜狐新媒体信息技术有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 计算 平台 故障 检测 方法 装置 解决方法 | ||
技术领域
本发明涉及云计算领域,特别涉及一种云计算平台故障检测方法、装置及解决方法、装置。
背景技术
随着云计算平台服务器部署规模越来越大,机器数量越来越多,及时发现并解决虚拟机故障成为维护云计算平台服务的重中之重。
从故障检测方面来看,目前云计算平台检测虚拟机故障的方法主要以人工发现为主:当用户使用虚拟机时发现虚拟机的服务不成功时,由用户通知数据中心管理员,数据中心管理员判断虚拟机运行于哪一台物理机上,然后检查物理机和虚拟机,确定物理机故障还是虚拟机故障,当管理员确定为虚拟机故障时,人工检查配置,确定故障原因,当管理员确定为物理机故障时,人工检查物理机故障位置,确定故障原因。但是,人工发现故障的方法,需要人为的去做故障检测,耗时较长,在云计算平台的规模越来越大时,会导致大量的人力和时间耗费在故障的检测中,浪费宝贵的人力物力。
目前还有一种故障自动检测技术,这种检测技术只检测服务是否正常,通过服务的检测来获得故障的机器并将故障信息报警至管理员,由管理员检查故障机器,确定具体故障原因。这种检测技术在一定程度比人工发现故障加快了发现故障的时间,但是,需要人为判断故障原因,而在云计算平台,很多服务器故障都是有共通性的,故障的原因往往是几种相同的问题,这就造成很多可确定的故障仍需要人工重复工作来发现。
从故障解决方面来看,由于很多服务器故障都是有共通性的,故障的原因往往是几种相同的问题,同样造成很多可确定的故障仍需要人工重复工作来解决。
可见,人工发现和人工解决虚拟机故障处理不仅工作量巨大,也会由于人工操作时间过长而导致服务中断时间过长,无法保证服务质量。
发明内容
有鉴于此,本发明的主要目的在于提供一种云计算平台故障检测方法、装置及解决方法、装置以实现自动发现和解决云计算平台故障的目的。
本发明提供了一种云计算平台故障检测方法,该方法具体包括初始检测步骤和下级检测步骤:
所述初始检测步骤包括:
检测初始检测层运行状态是否正常,如果是,则反馈该初始检测层运行状态正常信息,并结束流程;否则,确定初始检测层的下一级检测层作为当前检测层;
所述下级检测步骤包括:
获取当前检测层的运行状态,判断当前检测层运行状态是否正常;
如果是,则返回当前检测层上一级检测层故障的信息,结束流程;
如果否,将所述当前检测层的下一级检测层作为所述当前检测层,返回所述下级检测步骤,直至检测到各级检测层的最低级一层运行状态不正常,返回该最低级一层故障的信息。
优选地,所述初始检测层具体为虚拟机检测层;
所述检测虚拟机检测层运行状态是否正常具体通过对虚拟机所在宿主物理机的xend端口访问虚拟机获得所述虚拟机运行状态。
优选地,所述Hypervisor检测层为虚拟机的下一级检测层;
所述检测Hypervisor检测层运行状态是否正常具体通过以下步骤获得Hypervisor检测层运行状态:
判断所述虚拟机所在宿主物理机xend端口是否开放;
如果开放,则hypervisor检测层运行状态正常;
如果不开放,则hypervisor检测层运行状态不正常。
优选地,该方法还包括:
接收来自于所述虚拟机所在宿主物理机硬件相连的传感器的数据,如果所述数据超过预设安全数据范围,则:
触发所述虚拟机所在宿主物理机上的虚拟机迁移至第二物理机;
并且,若所述虚拟机所在宿主物理机装载了Intel的NodeManager,强制将所述虚拟机所在宿主物理机的功耗降到最低。
优选地,该方法还包括:
监测所述虚拟机所在宿主物理机CPU负载,若所述虚拟机所在宿主物理机CPU处于负载超负荷状态且负载超负荷状态持续时间超过允许时间,则:
通过触发所述虚拟机所在宿主物理机上的至少一个虚拟机迁移至第二物理机使所述第一物理机CPU负载在负荷范围之内。
本发明还提供一种云计算平台故障检测装置,该装置包括:
初始检测单元:用于检测初始检测层运行状态是否正常,如果是,则反馈该初始检测层运行状态正常信息,并结束流程;否则,确定初始检测层的下一级检测层作为当前检测层;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狐新媒体信息技术有限公司,未经北京搜狐新媒体信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210370060.3/2.html,转载请声明来源钻瓜专利网。