[发明专利]云计算容错方法及装置在审
申请号: | 201710166422.X | 申请日: | 2017-03-20 |
公开(公告)号: | CN108628708A | 公开(公告)日: | 2018-10-09 |
发明(设计)人: | 童遥;申光 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G06F11/20 | 分类号: | G06F11/20 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 江舟;董文倩 |
地址: | 518057 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 云计算 副本 处理机 主本 处理效率 选择处理 运行时 | ||
本发明提供了一种云计算容错方法及装置,其中,该方法包括:在云计算任务的主本在第一处理机上运行时,选择处理云计算任务的副本的多个第二处理机;根据副本分别在多个第二处理机上的处理效率,确定在主本容错时,处理副本的第二处理机的顺序。通过本发明,解决了相关技术中仅考虑一个处理机处理副本时平台可靠性低的技术问题。
技术领域
本发明涉及通信领域,具体而言,涉及一种云计算容错方法及装置。
背景技术
随着互联网和数据中心的发展,实时系统越来越多的应用于各种分布式环境而形成的云计算已越来越受到关注。云计算的主要思想是把互联网上的各种计算资源整合在一起,这些计算资源很多都是异构的,因此有效管理大规模异构的计算资源迫在眉睫,同时,通信效率和高可靠性也是云计算的内在要求,是系统提供给用户服务质量的重要衡量指标。
当大规模资源发生故障或错误时,比如多处理机发生失败,如何保证整个系统的正常运行并且得到正确的结果,即选用合适的容错调度策略,特别是对有着时间、通信、可靠性以及容错需求的任务,如何保证系统能够按需完成任务,是目前云计算需要研究的。所谓容错,是指在故障存在的情况下计算机系统不失败,仍然能够正常工作的能力,根据时间特性,故障可分为永久性故障和暂时性故障。传统的容错方法包括:重试、N版本程序设计和恢复块技术等容错方法,这些方法对于提高系统的可靠性,延长系统的使用寿命具有一定的应用价值。但是,这些传统容错方法没有考虑系统的实时性、系统开销等一系列问题,因此不适用于分布式系统。
相关技术中的分布式系统中最常用的容错技术是主/副本技术,每个任务有一个主本和一个副本,它们部署到两个不同的处理机上,传统的副本有三种执行方式:1)主动方式副本,图1为本发明相关技术中主动方式副本示意图,如附图1所示,图中横坐标表示调度的执行时间,处理机processor1上执行的是任务的主本,处理机processor2上执行的是任务的副本;2)被动方式副本,图2为本发明相关技术中被动方式副本示意图,如附图2所示,同样处理机processor1上执行的是任务的主本,处理机processor2上执行的是任务的副本;3)主副本间的重叠方式,图3为本发明相关技术中主副本重叠方式示意图,如附图3所示,主副本在执行时间上存在重叠,即这种方式的副本既能够利用主动方式副本无执行时间约束的优点,也具有被动方式副本的高效性。主动方式副本的特点是它与主本同时运行,两者间无同步关系;被动方式副本仅在主本执行失败时才启动执行,其优点在于在系统无故障的情况下,无需执行冗余任务,同时它允许不同故障状态下的任务的副本重叠使用,从而提高处理机的利用率。
但是,当前很多研究考虑资源容错调度时都是假设单机失败,可是大规模云计算系统使用的资源具有高度动态性和异构性,资源环境所固有的不可靠状态,使得云计算系统出现大规模资源失败的可能性大大增加。因此,仅假设单机失败对于研究云计算的容错问题显然存在很大的局限性。
针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。
发明内容
本发明实施例提供了一种云计算容错方法及装置,以至少解决相关技术中仅考虑一个处理机处理副本时平台可靠性低的技术问题。
根据本发明的一个实施例,提供了一种云计算容错方法,其特征在于,包括:在云计算任务的主本在第一处理机上运行时,选择处理所述云计算任务的副本的多个第二处理机;根据所述副本分别在所述多个第二处理机上的处理效率,确定在所述主本容错时,处理所述副本的第二处理机的顺序。
可选地,选择处理所述云计算任务的副本的多个第二处理机包括:获取所有备用处理机的负载;在所述所有备用处理中选择负载最小的多个处理机作为所述第二处理机。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710166422.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种稳健的服务器热疲劳冗余设计方法
- 下一篇:设备的硬盘检测方法及装置