[发明专利]提高多核处理器的可靠性的方法及装置有效
申请号: | 201210015133.7 | 申请日: | 2012-01-17 |
公开(公告)号: | CN102609327A | 公开(公告)日: | 2012-07-25 |
发明(设计)人: | 刘飞 | 申请(专利权)人: | 华为数字技术有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;黄晓军 |
地址: | 100085 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提高 多核 处理器 可靠性 方法 装置 | ||
技术领域
本发明涉及通信技术领域,尤其涉及一种提高多核处理器的可靠性的方法和装置。
背景技术
因业务部署的需要,多核处理器在通信领域应用越来越广泛,并对多核处理器的可靠性有更高的要求。
影响多核处理器可靠性的重要原因是因为多核处理器上多部署(运行)不同的软件,一套软件的bug(漏洞)便会导致某核异常,故多核的可靠性要低于单核。
现有技术中的一种提高多核处理器的可靠性的方法为:单核重启方法。即选取一核作为控制核,控制核保存其它核的部署和状态。当其它核发生软件bug后将进行复位,或者控制核监控到其它核丢心跳后会主动其它核;其它核在启动过程中会向控制核报告自身的业务部署配置,从而达到通过单核重启恢复业务的目的。
上述现有技术中的提高多核处理器的可靠性的方法的缺点为:由软件导致的bug或者通过单核重启能够恢复的故障,通过该方法业务能够恢复,若是核硬件导致的故障,通过单核重启也无法解决,此时业务将受到损伤。
发明内容
本发明的实施例提供了一种提高多核处理器的可靠性的方法和装置,以实现在单核发生硬件故障通过重启也无法恢复的情况下,也不会使单核上部署的业务受到损伤。
本发明实施例是通过以下技术方案来实现的:
一种提高多核处理器的可靠性的方法,包括:
当多核处理器中的某个单核发生故障并且重启后也不能恢复故障后,将所述某个单核从所述多核处理器中隔离;
基于所述多核处理器中的各个单核上部署的业务的优先级,将所述某个单核上部署的业务转移到其它所述多核处理器中的其它单核上。
一种提高多核处理器的可靠性的装置,包括:
故障处理模块,用于当多核处理器中的某个单核发生故障并且重启后也不能恢复故障后,将所述某个单核从所述多核处理器中隔离;
业务转移模块,基于所述多核处理器中的各个单核上部署的业务的优先级,将所述某个单核上部署的业务转移到其它所述多核处理器中的其它单核上。
由上述本发明的实施例提供的技术方案可以看出,本发明实施例通过引入故障核隔离和业务在核之间动态部署的技术特点,即使在单核发生硬件故障通过重启也无法恢复的情况下,也能确保优先级高的业务不受到损伤。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种提高多核处理器的可靠性的方法的处理流程图;
图2为本发明实施例一提供的一种分布式系统中的主控板对控制核进行故障检测和部署的示意图;
图3为本发明实施例一提供的一种控制核对各个转发核进行故障检测和部署的示意图;
图4为本发明实施例一提供的一种转发核2故障后将转发核2进行隔离的示意图。
图5为实施例二提供的一种提高多核处理器的可靠性的装置的具体结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。
实施例一
该实施例提供的一种提高多核处理器的可靠性的方法的处理流程如图1所示,包括如下的处理步骤:
步骤11、当多核处理器中的某个单核发生故障并且重启后也不能恢复故障后,将所述某个单核从所述多核处理器中隔离。
该实施例提供的一种多核处理器中的主控板和控制核的功能示意图如图2所示,主要包括:
主控板和多核处理器构成分布式系统,上述分布式系统中的主控板检测并记录各个单核的状态,按照一定算法在状态正常的单核中选取某个单核为控制核,将其它单核作为转发核。
该实施例提供的一种分布式系统中的主控板对控制核进行故障检测和部署的示意图如图2所示,主控板对所述控制核进行故障检测,主控板可采取心跳检测结合控制核主动上报故障的方式对所述控制核进行故障检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为数字技术有限公司,未经华为数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210015133.7/2.html,转载请声明来源钻瓜专利网。