[发明专利]一种线程故障处理方法、装置、介质及设备有效
申请号: | 202011314998.4 | 申请日: | 2020-11-20 |
公开(公告)号: | CN112306781B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 杨文文 | 申请(专利权)人: | 新华三大数据技术有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22;G06F11/30 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 450001 河南省郑州市高新技*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 线程 故障 处理 方法 装置 介质 设备 | ||
1.一种线程故障处理方法,其特征在于,应用于对象存储设备OSD进程,所述OSD进程包括第一OSD线程、第二OSD线程以及监控线程,所述方法包括:
在第一OSD线程运行过程中执行打点操作并设置超时时间,其中,所述打点为获取并记录当前的时间点;
由所述监控线程对所述第一OSD线程进行超时判断,若所述第一OSD线程存在线程超时,则确定所述第一OSD线程存在线程超时故障,并标记所述第一OSD线程的状态为线程故障状态;
停止向所述第二OSD线程回复心跳信息;
所述第二OSD线程确认所述第一OSD线程是否存在心跳超时故障;
若存在,则向监控器MON发送用于表征所述第一OSD线程存在心跳超时故障的故障消息,以使所述MON接收到所述故障消息后,若确认接收到的故障消息的次数超过预设的第一阈值,则将所述第一OSD线程的状态标记为down状态;
若确认所述第一OSD线程的状态被标记为down状态,获取第一OSD线程的属性信息,判断所述属性信息是否满足状态切换条件,所述属性信息包括IO平均时延和IO返回数;所述状态切换条件为:所述IO平均时延不超过第二阈值;所述IO返回数不超过第三阈值;所述第一OSD线程不存在线程超时;
若满足则向监控器MON发起状态切换请求,以使所述MON将所述第一OSD线程的状态标记为up状态。
2.根据权利要求1所述的方法,其特征在于,所述IO平均时延的确定方法具体包括:
计算每个时间间隔内的IO时延大小,其中每个时间间隔为相邻两个打点时间点的时间差;
基于计算出的各个IO时延确定超过预设时间阈值的IO时延的数量;
将所述数量与所述时间间隔的总数量之间的比值确定为所述IO平均时延。
3.根据权利要求1所述的方法,其特征在于,所述IO返回数的确定方法具体包括:
若确定本次IO下发和IO返回之间的时间间隔超过预先设定的超时时间阈值,则将计数结果加1,将加1后的计数结果确定为所述IO返回数。
4.根据权利要求1所述的方法,其特征在于,所述第一OSD线程不存在线程超时的确定方法为:
若确定所述第一OSD线程停止向第二OSD线程回复心跳消息的持续时间超过第四阈值,则确认所述第一OSD线程超时。
5.一种线程故障处理装置,其特征在于,应用于对象存储设备OSD进程,所述OSD进程包括第一OSD线程、第二OSD线程以及监控线程,所述装置包括:
处理模块,用于在第一OSD线程运行过程中执行打点操作并设置超时时间,其中,所述打点为获取并记录当前的时间点;
第一判断模块,用于由所述监控线程对所述第一OSD线程进行超时判断,若所述第一OSD线程存在线程超时,则确定所述第一OSD线程存在线程超时故障,并标记所述第一OSD线程的状态为线程故障状态;
停止模块,用于停止向所述第二OSD线程回复心跳信息;
所述装置,还包括:
第二判断模块,用于确认所述第一OSD线程是否存在心跳超时故障;
第一发送模块,用于若所述第二判断模块确认所述第一OSD线程存在心跳超时故障,则向监控器MON发送用于表征所述第一OSD线程存在心跳超时故障的故障消息,以使所述MON接收到所述故障消息后,若确认接收到的故障消息的次数超过预设的第一阈值,则将所述第一OSD线程的状态标记为down状态;
获取模块,用于若确认所述第一OSD线程的状态被标记为down状态,获取第一OSD线程的属性信息;
第三判断模块,用于判断所述属性信息是否满足状态切换条件,所述属性信息包括IO平均时延和IO返回数;所述状态切换条件为:所述IO平均时延不超过第二阈值;所述IO返回数不超过第三阈值;所述第一OSD线程不存在线程超时;
第二发送模块,用于若所述第三判断模块的判断结果为满足,则向监控器MON发起状态切换请求,以使所述MON将所述第一OSD线程的状态标记为up状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华三大数据技术有限公司,未经新华三大数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011314998.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法、装置、设备及计算机存储介质
- 下一篇:一种能自动清洁的电脑主机