[发明专利]设备内故障内存的定位方法及网络设备、存储介质在审
申请号: | 202210955310.3 | 申请日: | 2022-08-10 |
公开(公告)号: | CN115391076A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 卢双堂;於建军 | 申请(专利权)人: | 新华三技术有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310052 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 设备 故障 内存 定位 方法 网络设备 存储 介质 | ||
本申请提供设备内故障内存的定位方法,包括:搭建硬件测试环境系统;加载硬件错误检测服务配置文件和系统的工具动态库;开启硬件错误检测服务并执行后台守护程序;硬件错误检测服务在设备错误发生状态下通过中断或轮询捕获到故障信息并通过系统日志记录存储在所搭建的测试环境系统的结构体中;硬件错误检测服务从测试环境系统的工具动态库里的解析函数进行解析,解析出故障内存的故障类型以及故障位置。本申请实施例对故障内存或CPU定位精准,以及详细的错位类型。大大加快了生产进度。
技术领域
本申请涉及通讯设备技术领域,尤其涉及设备内故障内存的定位方法及网关设备、存储介质。
背景技术
现今,由于对设备要求越来越高,设备内存也越来越大,而对应的器件越来越多,内存的工艺精密度越来越高,颗粒储存单元间距越来越小。然后目前设备上报故障内存或CPU的故障信息,普遍存在定位不精确和错误类型不够详细的问题。例如通过mcelog服务对内存的IMC中McaBank寄存器进行简单的解析,只能将发生故障的内存位置报到channel级别,而不能精确DIMM级别。发生故障的CPU位置只能报到逻辑核级别,而不能精确到socket级别,且故障错误类型不详细很笼统。
发明内容
为了克服相关技术中存在的问题,本申请提供了设备内故障内存的定位方法及网关设备、存储介质。
根据本申请实施例第一方面提供了设备内故障内存的定位方法,包括搭建硬件测试环境系统;
加载硬件错误检测服务配置文件和系统的工具动态库;
开启硬件错误检测服务并执行后台守护程序;
硬件错误检测服务在设备错误发生状态下通过中断或轮询捕获到故障信息并通过系统日志记录存储在所搭建的测试环境系统的结构体中;
硬件错误检测服务从测试环境系统的工具动态库里的解析函数进行解析,解析出故障内存的故障类型以及故障位置。
优选的,还包括加载设备公司内存位置丝印配置文件,硬件错误检测服务从测试环境系统的工具动态库里的解析函数进行解析,结合设备公司内存位置丝印,获取故障内存在设备公司内定义的故障位置。
优选的,故障位置的路径包括socket()/channel()/dim()。
优选的,若故障内存在CPU上,则在硬件错误检测服务捕获到故障信息之前先判断CPU所用的平台。
优选的,故障信息还包括故障内存的温度信息或DQ引脚信息或burst突发传输信息。
优选的,保存解析后的故障信息到系统中对应的目录。
优选的,故障类型包括CE、UCE、parity、CRC、Fatal、UCNA、SRAO。
本申请实施例第二方面提供了网络设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时执行上述设备内故障内存的定位方法。
本申请实施例第三方面提供了存储介质,其上存储有计算机程序指令,程序指令被处理器执行时用于实现上述设备内故障内存的定位方法。
本申请实施例提供的技术方案可以包括以下有益效果:
本申请实施例对故障内存或CPU定位精准,以及详细的错位类型。大大加快了生产进度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入申请中并构成本申请的一部分,示出了符合本申请的实施例,并与申请一起用于解释本申请的原理。
图1是本申请方法流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华三技术有限公司,未经新华三技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210955310.3/2.html,转载请声明来源钻瓜专利网。