[发明专利]识别成员处的软故障有效
申请号: | 201910097385.0 | 申请日: | 2019-01-31 |
公开(公告)号: | CN110096407B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | M.佩雷拉;B.P.默里;J·S·贝尔图尔 | 申请(专利权)人: | 慧与发展有限责任合伙企业 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/07;G06F8/65 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 美国德*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 成员 故障 | ||
本文的示例涉及识别成员处的软故障,具体涉及识别专用于微服务的集群内的成员处的软故障。示例公开了识别集群内的每个成员的统计学评估。基于该统计学评估,在集群内的多个成员之一中识别软故障。响应于在集群中的成员之一处识别到软故障而执行一动作。
背景技术
故障,诸如硬故障和软故障,可导致总体系统的健康状况的严重退化。硬故障是部件发生灾难性故障的一种故障。而软故障是其中节点发生退化以使系统的性能可能受到影响的隐匿型故障。
附图说明
在附图中,相同的附图标记指代相同的部件或框。下面的详细描述参考了附图,附图中:
图1图示了根据本公开的包括专用于微服务的执行的集群和成员的示例系统;
图2图示了根据本公开的包括多个集群的示例系统,每个集群专用于不同的微服务;
图3图示了根据本公开的由计算设备可执行以在专用于微服务的集群中的多个成员之一处识别软故障的示例流程图;
图4图示了根据本公开的由计算设备可执行以在集群内经历软故障的成员处执行动作的示例流程图;
图5是根据本公开的具有处理资源的示例计算设备的框图,该处理资源执行机器可读存储介质中的、用于确定要在经历软故障的成员处执行哪个动作的指令;并且
图6是根据本公开的具有处理资源的示例计算设备的框图,该处理资源执行机器可读存储介质中的指令,所述指令用于基于从集群中的多个成员中的每个成员获取度量数据并计算统计学评估,来确定要在经历软故障的成员处执行哪个动作。
具体实施方式
在传统单片式系统体系结构中,系统的功能任务被放置在单个程序中执行。不同的功能任务可占用不同的处理能力,因此单片式系统体系结构可能不高效。例如,加密/解密比对数据进行存档占用更多的处理能力。但是,用于不同功能任务的不同的处理能力在执行单个程序时并未被考虑。
在更为现代化的面向服务的系统体系结构中,任务被打破为功能片段执行。这些任务根据其功能被分组并聚合到每个容器中。面向服务的体系结构的一种方法是微服务。微服务包括在集群内的成员(例如,节点)上运行的这些功能相似的任务的集合。在集群内的成员组上运行相似功能的任务带来了更高效的处理能力。
在这些系统体系结构中,执行前述任务的部件终究会经历部件故障,也称硬故障。集群管理技术用于从这些硬故障情形恢复。对于硬故障情形,当硬件部件故障时,集群管理器进行检测,并通过在基础建设上建立新的部件成员来恢复集群。集群管理器和基础设施可被设计有冗余,以防护硬故障。随着系统经受退化,集群式体系结构中的软故障更加隐匿,直到硬故障产生。此外,多个程序被写入诸如固件、操作系统、语言运行时、应用框架、应用代码等的多个层。在这些层之一中发生软故障的机会随时间而增加。
检测软故障的方法包括监视系统中的部件。在监视方法中,当部件偏离预期性能时,执行评估以定位根本原因。根据根本原因进行修复并且系统被更新。然而,这种方法花费很多时间来定位根本原因和更新系统。
因此,本公开在专用于微服务的集群内的成员处识别软故障。本公开基于所收集的度量数据来计算每个成员的统计值。基于统计值,本公开检测集群内的成员之一中的故障。响应于检测到故障,执行一动作以使集群继续执行微服务。
在另一示例中,针对性能而选择的动作可在所识别的正经受软故障的成员处执行。示例动作的列表包括:回收该成员(例如,销毁并重启)、通过增加附加的成员来扩展集群、以及通过移除该成员来缩减集群。这些示例的每一个都是允许集群以最小的中断继续执行微服务的动作。这允许其他成员继续执行微服务,而不会响应于所识别的正经历软故障的成员而降低整个集群。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于慧与发展有限责任合伙企业,未经慧与发展有限责任合伙企业许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910097385.0/2.html,转载请声明来源钻瓜专利网。