[发明专利]基于硬件监视和微包协议的关键数据恢复方法有效

专利信息
申请号: 201010579850.3 申请日: 2010-12-09
公开(公告)号: CN102012850A 公开(公告)日: 2011-04-13
发明(设计)人: 张伟功;丁瑞;高兰志;朱晓燕;张永祥;荣金叶;邱庆林 申请(专利权)人: 首都师范大学
主分类号: G06F11/14 分类号: G06F11/14
代理公司: 暂无信息 代理人: 暂无信息
地址: 100048 北京市西三*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 硬件 监视 协议 关键 数据 恢复 方法
【说明书】:

技术领域

发明涉及三模冗余容错计算机系统中的关键数据恢复方法,尤其涉及基于硬件监视和微包协议的三模冗余容错计算机系统中的关键数据恢复方法。

背景技术

三模冗余(TMR)容错计算机通常用于要求可靠性比较高的环境中,如果其中一台机器发生严重故障后,系统降级为双级运行模式,在双机运行过程中恢复故障机器,并且在恢复过程中不中断系统的正常运行,使系统能够重新从双机运行模式恢复到三模运行状态,从而提高三模冗余容错计算机的可靠性与连续性。。对于可修复TMR容错系统来说,恢复是实现容错系统容错目的和提高系统可靠性和可用性的重要环节,因此故障恢复对于研究三模冗余容错计算机来说是一项至关重要的技术,解决得好坏直接影响到三模冗余系统的功能及运行操作的正确性。

而目前的故障恢复方法都是针对专门的具体应用。文献1(Nakamikawa T,Morita Y,Yamaguchi S.High Performance Fault Tolerant Computer and its Fault Recovery[J].1997 Pacific Rim International Symposium on Fault-Tolerant Systems,1997:2-6)给出了基于存储器双机窃取拷贝的恢复方案,可以不中断系统运行,快速实现大量内存数据的传送,但需要复杂的硬件支持,更适合在双机系统中进行实现。文献2(Yu Shu-Yi,McCluskey E J.On-line Testing and Recovery in TMR Systems for Real-Time Applictions[J].Test Conference Proceedings.International,2001,240-249)是一种部分恢复方案,在数据/输出表决时一旦检查到故障状态,立即对故障机器故障区域进行恢复,可实现对瞬态故障的状态恢复,但不适用于模块级恢复。文献3(李海山,欧中红,杨升春等.基于COTS的容错服务器及其故障恢复技术[J].计算机工程,2007,33(8):253-255)提出的阶梯型恢复方法以进程为单位逐步恢复系统到三模冗余状态。恢复过程中,系统采用双机与三模混合运行,管理复杂,比较适合在三模冗余容错服务器中应用。

文献4(张伟功,朱晓燕,关永,等.基于微包协议的三模冗余容错计算机无缝重构方法[J].计算机科学,2009,(36)6:286-289)中提出的基于微包协议的恢复方法通过逻辑模块的优化设计,消除了单点故障模式,可以极大地提高系统应用的可靠性与可信性。但是对于内存数据和当前状态的管理则是通过软件实现,主要有三方面的不足:首先,采用单向链表方式按更新频度对关键数据按队列进行管理,如果内存数据和机器运行状态有更新则需要用户通过调用软件程序通知TMR容错计算机的恢复程序,多数情况下用户会集中通知,否则需要在每一个程序分支中通知恢复程序,执行效率低;其次,对关键数据的监测是以单向链表上的链表块为单位,如果关键数据有更新,则对应的链表块数据的修改标志会重新置位,而用户的修改不可能局限在一个块内,也不可能整块数据都需要重新传送恢复,因此以软件方式实现的关键数据管理导致应用方便性和可监测性不足,监视粒度大;再次,原来的恢复方法只能利用周期任务的空闲时间,当空闲时间能够传送的数据量小于每个周期中用产更改量时有问题,不能进行无缝恢复。

发明内容

本发明旨在解决现有技术中存在的技术问题,尤其是上述文献4中存在的不足,使得在不中止系统正常工作的情况下对系统进行恢复,以保证三模冗余容错系统正常运算与控制过程的连续性与一致性。

本发明为解决上述技术问题所采取的技术方案为:一种基于硬件监视和微包协议的三模冗余容错计算机系统中的关键数据恢复方法,其特征在于:把需要恢复的关键数据分成大小相等的硬件数据块,再把硬件数据块划分成大小相同的监测包;同时在硬件上针对每个硬件数据块设置监视器,该监视器能监测的监测包数与每个硬件数据块划分的监测包数相等,一旦发现某监测包有更新或修改,则形成对该硬件数据块的数据区域重新传送的依据,重新传送数据时以监测包为单位进行以减少重新传送的数据量;监视器为每个硬件数据块配置四个寄存器:表示硬件块在整个监控内存区中的位置的块起始地址寄存器、用来决定监测那些包的块内监测包使能标志寄存器、用来记录数据修改的监测结果的块内监测包变化标志寄存器和在监测包被恢复时用来清除相应的包的修改标志的块内监测包修改标志清除寄存器。

本发明提出的上述技术方案克服了传统容错计算机在故障恢复方面的缺陷。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首都师范大学,未经首都师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010579850.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top