[发明专利]异构系统的故障诊断、恢复方法及装置有效
申请号: | 201310642805.1 | 申请日: | 2013-12-02 |
公开(公告)号: | CN103605593A | 公开(公告)日: | 2014-02-26 |
发明(设计)人: | 王书义;杨德光 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22;G06F11/14;G06F17/30 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 陈英俊 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 系统 故障诊断 恢复 方法 装置 | ||
技术领域
本发明涉及异构系统技术领域,更为具体地,涉及一种异构系统的故障诊断、恢复方法及装置。
背景技术
异构系统被视为计算机处理器继单核和多核之后的第三个时代,其能够实现不同类型指令集和体系架构的计算单元之间的协同计算和彼此加速,从而突破CPU的发展瓶颈,有效解决能耗和系统的扩展性问题。
在X86系统与FPGA(Field Programmable Gate Array,现场可编程逻辑门阵列)系统两者结合的异构系统中,X86系统能够对异构系统起到主要控制作用,并维护整个异构系统的正常工作;而FPGA系统由于其精准的时序控制,能够提升异构系统的性能,但其需要X86系统的控制和维护来保证持续正常的运行。
在X86系统与FPGA系统的交互过程中,由于FPGA器件接口数量的限制,往往集中资源专注于对外处理,而对于其内部控制通路常常因为冗余代价太大,一般只设一个冗余链路,如此便抑制了冗余链路的保障效果。
为了保障FPGA系统稳定的受控于X86系统,则需要设置多个冗余链路。也就是说,需要消耗较大代价进行控制通路冗余。即便如此,也不能够保障FPGA系统的稳定受控。因为控制数据总会到达同一个控制点,当FPGA系统出现较为严重的全局故障时,就可能会导致所有的冗余链路均告失效,从而造成FPGA系统整个控制通路出现故障。
在X86系统与FPGA系统两者结合的异构系统中,一旦控制通路出现故障,即会出现X86系统对FPGA系统的控制和维护问题,从而使整个FPGA系统失去持续正常的工作能力,也无法再从X86系统获得控制类数据,使故障的排查和分析遇到困难,从而增加调试问题的成本。
发明内容
鉴于上述问题,本发明的目的是提供一种异构系统的故障诊断、恢复方法及装置,以实现对FPGA的通信控制链路的备份、故障诊断信息的获取和偶发性故障的恢复,提高系统故障的调试能力和稳定运行能力。
根据本发明的一个方面,提供一种异构系统的故障诊断、恢复方法,包括:
在X86与FPGA组成的异构系统中,按照物理位置和逻辑相关性对FPGA进行逻辑区域划分,并在FPGA中预设故障分类判断,对故障进行分类识别;
当作为正常情况下的X86与FPGA之间的通信通路的第一通路出现故障时,X86启用第二通路作为X86与FPGA通信控制的备份链路;其中,X86通过第二通路向ARM发出指令,然后再通过ARM实现对FPGA的通信控制;其中,
在X86启用第二通路的同时,第三通路根据所划分的逻辑区域向FPGA反馈故障类别,并且X86通过向ARM发出故障诊断指令对第一通路进行故障诊断;
在FPGA中,根据所述ARM对所述第一通路的故障诊断结果对发生故障的逻辑区域进行定位,然后由ARM发出恢复指令并通过第三通路对发生故障的逻辑区域进行复位,以完成对异构系统的故障恢复。
其中,在X86通过向ARM发出故障诊断指令对第一通路进行故障诊断的过程中,X86通过预设的故障处理方案,向ARM发出故障诊断指令对FPGA中出现的故障进行诊断。
其中,在通过第三通路对发生故障的逻辑区域进行复位的过程中,将发生故障的逻辑区域与未发生故障的逻辑区域进行分隔,实现只对发生故障的逻辑区域进行复位。
另一方面,本发明还提供一种异构系统的故障诊断、恢复装置,包括:
故障分类单元,用于在X86与FPGA组成的异构系统中,按照物理位置和逻辑相关性对FPGA进行逻辑区域划分,并在FPGA中预设故障分类判断,对故障进行分类识别;
备份链路启用单元,用于当作为正常情况下的X86与FPGA之间的通信通路的第一通路出现故障时,第三通路根据所划分的逻辑区域向FPGA反馈故障类别,然后X86启用第二通路作为X86与FPGA通信控制的备份链路;其中,X86通过第二通路向ARM发出指令,然后再通过ARM实现对FPGA的通信控制;
故障诊断单元,用于在X86启用第二通路的同时,第三通路根据所划分的逻辑区域向FPGA反馈故障类别,并且X86通过向ARM发出故障诊断指令对第一通路进行故障诊断;
故障恢复单元,用于在FPGA中,根据所述ARM对所述第一通路的故障诊断结果对发生故障的逻辑区域进行定位,然后由ARM发出恢复指令并通过第三通路对发生故障的逻辑区域进行复位,以完成对异构系统的故障恢复。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310642805.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:旋转式压机和用于运行旋转式压机的方法
- 下一篇:煤气管道带煤气作业方法