[发明专利]识别对象存储设备亚健康的方法、装置和数据存储系统有效
申请号: | 201780003315.3 | 申请日: | 2017-12-18 |
公开(公告)号: | CN108235751B | 公开(公告)日: | 2020-04-14 |
发明(设计)人: | 谢会云 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F3/06 | 分类号: | G06F3/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 对象 存储 设备 亚健康 方法 装置 数据 存储系统 | ||
本发明实施例涉及一种识别亚健康对象存储设备(Object Storage Device,OSD)的方法、装置和系统。数据存储系统的处理读写数据请求的主OSD将备OSD处理读写数据请求的时延上报给系统中的管理节点,由该管理节点根据接收到的上报消息确定系统中哪些OSD处于亚健康状态。由于收集的数据更全面,管理节点可以更准确地判断系统中的亚健康OSD。
技术领域
本发明实施例涉及存储技术,特别是识别对象存储设备(Object StorageDevice,OSD)亚健康的方法、装置和数据存储系统。
背景技术
分布式存储系统中某个存储节点出现亚健康问题会严重影响整个分布式存储系统可用性。传统的解决方案可以是存储节点定期向管理设备上报心跳,如果存储节点发生亚健康故障导致心跳丢失,则对该节点进行离线隔离处理。或者也可以是存储节点自身植入故障检测模块,检测到输入/输出(简称I/O)延迟大于预定的阈值,则向管理节点上报故障,管理节点对其进行离线隔离。传统的分布式存储系统对存储节点亚健康的监控与处理延迟很大,亚健康故障对分布式存储系统的影响时间长,分布式存储系统的可用性大打折扣。
发明内容
有鉴于此,本申请提供了一种识别OSD亚健康的方法、装置和系统。
本申请的第一方面提供了一种数据存储系统,所述系统包括管理节点和多个存储节点,其中所述系统中部署了多个OSD,所述多个OSD位于所述多个存储节点上;所述多个OSD包括第一OSD和第二OSD。其中,所述第一OSD用于接收第一写数据请求,所述第一写数据请求中包括待写入数据块以及相应的待写入的分区,根据分区分配视图确定所述待写入的分区的备OSD为所述第二OSD,将所述第一写数据请求复制给所述第二OSD,获得所述数据块复制到所述第二OSD所耗时长之后向所述管理节点发送第一报告消息,所述第一报告消息中包括所述第一OSD的标识、所述第二OSD的标识以及所述第二OSD的健康状态信息。所述管理节点用于接收所述第一报告消息,根据所述第一报告消息更新所述管理节点上保存的OSD健康状态记录,根据所述OSD健康状态记录确定所述第二OSD为亚健康OSD,所述OSD健康状态记录包括所述其他OSD上报的所述第二OSD的健康状态信息。
由于第一OSD将待写入数据复制到第二OSD的时候,会记录其消耗的时长来作为判断该第二OSD是否处于亚健康的参考。因此,相比于现有技术,本申请提供的系统能够更加全面地检测系统中节点的故障情况,从而提高识别亚健康OSD的准确性。
本申请的第二方面,提供了一种识别亚健康OSD的方法,所述方法应用于上述第一方面所提供的数据存储系统中。该方法包括如下步骤:
所述第一OSD接收第一写数据请求,所述第一写数据请求中包括待写入所述第一OSD所管理的分区的数据块以及相应的待写入的分区,根据分区分配视图确定所述待写入的分区的备OSD为所述第二OSD,将所述写数据请求复制给所述第二OSD,获得所述数据复制到所述第二OSD所耗时长之后向所述管理节点发送第一报告消息,所述第一报告消息中包括所述第一OSD的标识、所述第二OSD的标识以及所述第二OSD的健康状态信息。
所述管理节点接收所述第一报告消息,根据所述第一报告消息更新所述管理节点上保存的OSD健康状态记录,根据所述OSD健康状态记录确定所述第二OSD为亚健康OSD,所述OSD健康状态记录包括所述其他OSD上报的所述第二OSD的健康状态信息。
基于同样的理由,本申请提供的方法能够更加全面地检测系统中节点的故障情况,从而提高识别亚健康OSD的准确性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780003315.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:指纹识别系统的按压检测方法、装置和终端设备
- 下一篇:一种多屏幕显示计算机