[发明专利]一种多处理器系统故障恢复的方法及装置无效
| 申请号: | 200810056461.5 | 申请日: | 2008-01-18 |
| 公开(公告)号: | CN101216793A | 公开(公告)日: | 2008-07-09 |
| 发明(设计)人: | 薛蕴全;唐锋;武绍芸;邓亚 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F15/16 |
| 代理公司: | 北京凯特来知识产权代理有限公司 | 代理人: | 郑立明 |
| 地址: | 518129广东省*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 处理器 系统故障 恢复 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,尤其涉及一种多处理器系统故障恢复的方法及装置。
背景技术
多处理器系统是具备多个微处理器的计算机系统,包括传统的由多个单核芯片组成的多处理器系统,单个多核芯片的多核系统和由多个多核芯片组成的多处理器系统。在多处理器系统中,由于其多个微处理器能够同时进行计算处理,因此处理能力比普通单处理器系统要强大很多。多处理器系统也因其强大的计算处理能力得到越来越广泛的应用。
但是,随着多处理器系统中处理器数量的增加,系统发生故障的概率也将随之增加,而对于多处理器系统而言,系统中任何一个处理器发生故障都可能影响整个系统的正常运行。因此,有必要对多处理器系统进行故障管理。其中,故障恢复是故障管理的重要组成部分,所述的故障恢复是指在系统发生故障后,通过各种手段使系统能够继续运行。
目前常见的一种故障管理方法是,预先准备若干个冗余的处理器作为备份处理器,在系统正常运行时,所述的冗余处理器不参与系统工作;当发现系统中某个或某些处理器发生故障时,将故障处理器上的业务和数据切换到冗余处理器上,使系统能够继续运行。这种故障管理方法中,通过将故障处理器上的业务和数据切换到冗余处理器上的操作实现系统故障恢复,但是,由于所述的冗余处理器在系统正常工作时不参与工作,因此这种故障恢复方法将造成对处理器资源的浪费。另外,如果冗余处理器数量太少,当系统中出现故障的处理器较多时,由于冗余处理器数量不足而失去故障恢复能力;如果冗余处理器数量过多,将造成资源浪费和成本提高。
现有技术中还存在另外一种常见的故障管理方法,具体是在多个处理器上运行相同的软件业务,在提供相同输入数据的情况下,各个处理器应产生相同的数据输出。如果某个处理器发生故障,产生了异常的数据输出,则根据多数原则进行判定,将异常的数据输出屏蔽掉。这种故障管理方法中,通过屏蔽故障处理器输出的异常数据实现系统故障恢复,但是,由于系统中多个处理器运行相同的软件业务,因此降低了多处理器系统的工作效率,浪费了处理器的处理能力。
发明人在实现本发明的过程中,发现现有技术中对多处理器系统故障恢复的操作均存在浪费处理器的计算能力,以及多处理器系统工作效率低的问题。
发明内容
本发明的实施例提供了一种多处理器系统故障恢复的方法及装置,从而避免对处理器资源的浪费。
一种多处理器系统故障恢复的方法,其特征在于,包括:
选定的主处理器对发生故障的硬件单元进行隔离,并将分配给所述发生故障的硬件单元的业务重新分配给系统中针对所述业务具备处理能力的正常硬件单元。
一种多处理器系统故障恢复的装置,其特征在于,包括:
隔离模块,用于控制主处理器对发生故障的硬件单元进行隔离;
业务分配模块,用于在获知所述对故障硬件单元进行隔离的操作成功后,控制主处理器将分配给所述发生故障的硬件单元的业务重新分配给系统中针对所述业务具备处理能力的正常硬件单元。
由上述本发明的实施例提供的技术方案可以看出,由于本发明实施例中采用选定的主处理器对系统进行故障恢复操作,且充分利用系统中的每个处理器资源,提高了多处理器系统的工作效率,且降低了系统实现成本。
附图说明
图1为本发明实施例的处理过程示意图;
图2为本发明应用实施例的一种系统示意图;
图3为本发明实施例提供的装置的结构示意图;
图4为本发明实施例提供的用于确定主处理器的模块结构示意图。
具体实施方式
本发明实施例中,选定的主处理器对发生故障的硬件单元进行隔离,并将分配给所述发生故障的硬件单元的业务重新分配给系统中针对所述业务具备处理能力的正常硬件单元。所述主处理器对发生故障的硬件单元进行隔离的目的在于防止故障硬件单元影响系统中其他正常硬件单元的运行,具体隔离方式可以采用例如停止故障硬件单元工作、阻止其与其他处理器之间的通信等等方式实现。
其中,所述选定的主处理器对发生故障的硬件单元进行隔离的步骤前,该方法还可以包括:主处理器控制发生故障的硬件单元进行复位,且允许在复位失败的情况下,重复对所述发生故障的硬件单元的复位操作,如果在预定次数内复位成功,则对多处理器系统的故障恢复操作完成,不需要再继续进行后续故障恢复操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810056461.5/2.html,转载请声明来源钻瓜专利网。





