[发明专利]内存故障分析方法及计算机设备有效
申请号: | 202211312307.6 | 申请日: | 2022-10-25 |
公开(公告)号: | CN115686901B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 曹瑞;张光彪;甘延;鲍全洋 | 申请(专利权)人: | 超聚变数字技术有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 刘春丽 |
地址: | 450046 河南省郑州市郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 内存 故障 分析 方法 计算机 设备 | ||
本申请提供了一种内存故障分析方法及计算机设备,涉及内存技术领域。该方法中,基于内存发生故障的第一物理位置,确定内存的第一物理区域存在第一故障类型,在确定发生故障的第二物理位置后,基于发生故障的第二物理位置和至少一个第一物理位置,确定内存的第二物理区域存在第二故障类型。若第二物理区域包括第一物理区域上的每个第一物理位置、且第一物理区域不包括第二物理位置,则取消第一故障类型,确定内存仅包括第二故障类型,实现了动态确定内存的故障类型,使内存的故障类型随着故障的不断发生而动态变化,有助于减少内存所存在的故障类型,进而缩小内存的待修复区域,而在进行内存修复时,有助于减少内存上被隔离的物理区域。
技术领域
本申请涉及内存技术领域,尤其涉及一种内存故障分析方法及计算机设备。
背景技术
内存是计算机设备中必不可少的一个部件,在使用过程中有一定概率会出现内存故障。内存故障包括可纠正(corrected error,CE)级别故障和不可纠正(uncorrectederror,UCE)级别故障。其中,CE级别故障可以自动修复,UCE级别故障无法自动修复,且通常会导致计算机设备的系统宕机。
由于内存发生多个故障后,内存上的部分物理区域会呈现出现行故障、列故障或存储阵列故障等故障类型。相关技术中,为了降低UCE级别故障导致系统宕机的概率,会对内存存在的故障类型进行分析,若基于当前发生故障确定内存的一个物理区域存在一个故障类型(如列故障),便会对内存上的一个物理区域进行隔离修复。之后,内存发生新故障,若基于新故障确定内存的另一个物理区域存在另一个故障类型(如行故障),则对内存上的另一个物理区域进行隔离修复。这就导致内存的可用存储空间越来越小,严重影响了内存的存储性能。
发明内容
本申请实施例提供一种内存故障分析方法及计算机设备,能够动态确定内存存在的故障类型进行,有助于减少内存上被隔离的物理区域,提高内存的存储性能。
为达到上述目的,本申请的实施例采用如下技术方案:
第一方面,提供了一种内存故障分析方法,用于计算机设备,该计算机设备包括中央处理器CPU和带外控制器,该方法由带外控制器执行;该方法包括:若内存发生故障的多个第一物理位置所在的第一物理区域满足第一预设条件,确定内存的第一物理区域存在第一故障类型;第一故障类型指示了内存的待修复区域包括第一物理区域;若内存发生故障的目标物理位置所在的第二物理区域满足第二预设条件,确定内存的第二物理区域存在第二故障类型;第二故障类型指示了内存的待修复区域包括第二物理区域,目标物理位置包括第二物理位置和至少一个第一物理位置,第二物理位置发生故障的时刻晚于每个第一物理位置发生故障的时刻;若第二物理区域包括第一物理区域上的每个第一物理位置、且第一物理区域未包括第二物理位置,确定内存的故障类型包括第二故障类型、且不包括第一故障类型。
该方案中,基于内存发生故障的多个第一物理位置,确定内存的第一物理区域存在第一故障类型后,若确定内存发生故障的第二物理位置,则基于内存发生故障的目标物理位置,确定内存的第二物理区域存在第二故障类型,该目标物理位置包括第二物理位置和至少一个第一物理位置。在此基础上,若第二物理区域包括第一物理区域上的每个第一物理位置、且第一物理区域未包括第二物理位置,则取消内存的第一物理区域存在的第一故障类型,确定内存的故障类型仅包括第二物理区域上的第二故障类型,实现了动态确定内存的故障类型,这样,内存的故障类型会随着故障的不断发生而动态变化,一方面,能够使得内存的当前故障类型更加准确的表现故障位置的分布特性,另一方面,通过取消故障位置被覆盖的故障类型,能够在所修复的发生故障的物理位置的数量不变的基础上,缩小内存的待修复区域。
相对于相关技术中的方案,基于该实施例所确定内存的故障类型进行故障修复时,有助于减少内存上被隔离的物理区域,提高内存的存储性能。另外,由于基于第二物理位置确定内存的故障类型时,结合了之前发生故障的多个第一物理位置,因此,可以更全面的分析内存上发生故障的物理位置的规律,有助于提高所确定的故障类型的准确性,进而为后续对内存进行修复时提供精准的待修复区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于超聚变数字技术有限公司,未经超聚变数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211312307.6/2.html,转载请声明来源钻瓜专利网。