[发明专利]故障注入的方法和装置有效
申请号: | 201810294045.2 | 申请日: | 2018-03-30 |
公开(公告)号: | CN108683553B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 陈锐;秦晓鹏;丁俊;刘维;钟星汉 | 申请(专利权)人: | 北京华为数字技术有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 孙涛;毛威 |
地址: | 100085 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 故障 注入 方法 装置 | ||
本申请提供了一种故障注入的方法和装置,该方法应用于云化网络中,该云化网络包括一个或多个虚拟机,其中,每个虚拟机包括内核模块和节点操作代理,该方法包括:该一个或多个虚拟机中的第一虚拟机的内核模块从第一虚拟机的节点操作代理获取报文特征信息;第一虚拟机的内核模块对该第一虚拟机的网络报文进行监控;在第一虚拟机的内核模块监控到与报文特征信息匹配的第一报文时,对第一报文执行延迟操作,并向该一虚拟机的节点操作代理发送第一通知信息;第一虚拟机的节点操作代理根据第一通知信息,执行第一对象的故障注入操作,其中,第一对象用于承载第一报文对应的业务,能够在有效对象的有效时机注入故障,有助于提升云化网络的可靠性。
技术领域
本申请涉及计算机技术领域,并且更具体地,涉及一种故障注入的方法和装置。
背景技术
目前,越来越多的运营商开始发展云化网络。云化网络的技术核心是广义的软件定义网络。相关软件是运行在云化基础设施上的。运营商任务电信级可靠性是云化网络商用部署成功的关键。因此能否在云化基础设施上构筑可靠性水平较高的网络,是帮助运营商云化网络商业成功的关键。验证云化网络可靠性最主要的手段就是故障演练。
在现有技术中,故障演练方案是通过随机注入故障的方式测试网络的可靠性。但是这种方式随机性较强,问题可复现性差,导致的最直接的问题是需要增加测试次数才能找到低概率发生的潜在问题,比较浪费时间、人力和物力。因此,亟需提出一种故障注入的方案提高云化网络的可靠性。
发明内容
本申请提供一种故障注入的方法和装置,能够实现故障注入的时机精准和对象精准,有助于提高云化网络的可靠性。
第一方面,提供了一种故障注入的方法,所述方法应用于云化网络中,所述云化网络包括一个或多个虚拟机,其中,每个虚拟机包括内核模块和节点操作代理,所述方法包括:
所述一个或多个虚拟机中的第一虚拟机的内核模块从所述第一虚拟机的节点操作代理获取报文特征信息;
所述第一虚拟机的内核模块对所述第一虚拟机的网络报文进行监控;
在所述第一虚拟机的内核模块监控到与所述报文特征信息匹配的第一报文时,对所述第一报文执行延迟操作,并向所述第一虚拟机的节点操作代理发送第一通知信息,所述第一通知信息用于指示所述第一虚拟机的内核模块已监控到与所述报文特征信息匹配的第一报文;
所述第一虚拟机的节点操作代理根据所述第一通知信息,执行第一对象的故障注入操作,其中,所述第一对象用于承载所述第一报文对应的业务。
在本申请实施例中,第一虚拟机的内核模块通过对所述第一虚拟机的网络报文进行监控,并在监控到与报文特征信息匹配的第一报文时,对第一报文执行延迟操作,使得所述第一虚拟机的节点操作代理根据所述第一通知信息,执行第一对象的故障注入操作,能够实现故障注入的时机精准和实例精准,有助于提高云化网络的可靠性。
可选地,第一对象可以是进程或实例。
在一种可能的实现方式中,所述第一对象是所述第一虚拟机中的对象,其中,所述第一虚拟机的节点操作代理根据所述第一通知信息,执行所述第一对象的故障注入操作,包括:
所述第一虚拟机的节点操作代理根据所述第一通知信息,查询所述第一对象对应的故障信息;
所述第一虚拟机的节点操作代理根据所述第一对象对应的故障信息,在所述第一对象注入故障。
因此,若第一对象在第一虚拟机中,则所述第一虚拟机的节点操作代理可以对第一对象执行故障注入操作。
可选地,所述方法还包括:
所述第一虚拟机的节点操作代理向所述第一虚拟机的内核模块发送第二通知信息,所述第二通知信息用于向所述第一虚拟机的内核模块通知已在所述第一对象中注入故障;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华为数字技术有限公司,未经北京华为数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810294045.2/2.html,转载请声明来源钻瓜专利网。