[发明专利]一种CE风暴抑制方法、装置及相关设备在审
申请号: | 202210552402.7 | 申请日: | 2022-05-20 |
公开(公告)号: | CN114911659A | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 高仲于;李诗逸;刁家庆;丁辉 | 申请(专利权)人: | 深信服科技股份有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 吴欣蔚 |
地址: | 518055 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 ce 风暴 抑制 方法 装置 相关 设备 | ||
本申请公开了一种CE风暴抑制方法、装置、系统及计算机可读存储介质,包括:当监测到故障内存段发生CE内存故障时,采集单位时间内故障内存段对应的CE数量;当CE数量超出第一阈值时,拦截向系统层上报的CE内存故障对应的故障上报信号;监测对故障内存段的应用访问数量,并在应用访问数量低于第二阈值后恢复向系统层上报故障上报信号。应用本申请所提供的技术方案,当CE数量超出一定数量时,则可以对各CE内存故障的故障上报信号进行拦截,以有效避免故障信息被上报至系统层进行故障处理,从而可以避免大量的系统资源被占用,实现了对CE风暴的有效抑制,进一步保障了系统的稳定性,提高了业务性能。
技术领域
本申请涉及内存技术领域,特别涉及一种CE风暴抑制方法,还涉及一种CE风暴抑制装置、系统及计算机可读存储介质。
背景技术
CE(Corrected error,可纠正错误)是指在硬件平台的容错范围内可以被纠正的数据错误,已有容错纠正方案可恢复此错误,系统或应用不会因此类型错误停止运行。
请参考图1,图1为现有技术中的一种CE内存故障处理机制的示意图,当上层应用读取内存数据触发CE内存故障时,在固件优先模式下,硬件平台会向系统发出CMCI中断(Corrected Machine Check Interrupt,校正机器检查中断)和NMI中断(Non MaskableInterrupt,不可屏蔽中断)。其中,CMCI中断和threshold_interrupt函数绑定,在触发CMCI中断时,会调用threshold_interrupt函数记录mcelog日志,增加EDAC(Error DetectionAnd Correction,错误检测与纠正)计数。NMI中断则会触发错误处理逻辑,同样会记录CE内存故障信息到mcelog日志,同时会在满足一定条件时对CE内存故障进行处理。
在现有流程下,多应用同时触发大量CE内存故障时,会导致操作系统要处理大量CMCI中断,并且会记录错误信息到mcelog,从而引发CE风暴。由于CE内存故障数量过多,这个过程会大量占用系统资源,影响系统稳定性,降低业务性能。
因此,如何对内存中可能发生的CE风暴进行有效抑制,进一步保障系统的稳定性是本领域技术人员亟待解决的问题。
发明内容
本申请的目的是提供一种CE风暴抑制方法,该CE风暴抑制方法可以对内存中可能发生的CE风暴进行有效抑制,从而保障系统的稳定性;本申请的另一目的是提供一种CE风暴抑制装置、系统及计算机可读存储介质,均具有上述有益效果。
第一方面,本申请提供了一种CE风暴抑制方法,包括:
当监测到故障内存段发生CE内存故障时,采集单位时间内所述故障内存段对应的CE数量;
当所述CE数量超出第一阈值时,拦截向系统层上报的所述CE内存故障对应的故障上报信号;
监测对所述故障内存段的应用访问数量,并在所述应用访问数量低于第二阈值后恢复向所述系统层上报所述故障上报信号。
可选地,所述拦截向系统层上报的所述CE内存故障对应的故障上报信号,包括:
在预设可编程寄存器中设置故障上报信号屏蔽标志,以在检测到所述故障上报信号屏蔽标志后停止向所述系统层发送所述故障上报信号。
可选地,所述监测对所述故障内存段的应用访问数量,并在所述应用访问数量低于第二阈值后恢复向所述系统层上报所述故障上报信号,包括:
监测所述应用访问数量;
当所述应用访问数量低于所述第二阈值时,为所述预设可编程寄存器清除所述故障上报信号屏蔽标志,以恢复向所述系统层发送所述故障上报信号。
可选地,所述拦截向系统层上报的所述CE内存故障对应的故障上报信号之后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深信服科技股份有限公司,未经深信服科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210552402.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法和相关装置
- 下一篇:一种负极片及锂离子电池