[发明专利]在群集文件系统中的文件系统安装有效
申请号: | 200880023511.8 | 申请日: | 2008-06-26 |
公开(公告)号: | CN101689129A | 公开(公告)日: | 2010-03-31 |
发明(设计)人: | K·冈达;B·希尔;F·施穆克 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F11/00 | 分类号: | G06F11/00 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 李向英 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 群集 文件系统 中的 安装 | ||
技术领域
本发明一般涉及分布式文件系统,更具体来说,涉及在发生通信 故障之后快速而有效地防止群集文件系统中的节点解除自身防守而 安装文件系统。
背景技术
通信技术的进步已经允许许多机器聚合成具有实际上无限制的 处理能力和存储容量的计算群集,其可以用来解决比单个机器能够解 决的问题大得多的问题。由于群集由独立而冗余的计算机构成,因此, 它们具有容错的潜力。这使得它们适合于其他类型问题,在这些类型 的问题中可靠性是最主要的。结果,在过去几年,人们对于群集技术 有巨大的兴趣。
现有技术中发现的群集文件系统包括General Parallel File System(GPFS)TM。GPFS是可用于SPTM并行巨型计 算机以及群集上的群集计算机的并行、共享磁盘文件系统, 提供与在单个机器上运行的通用POSIX文件系统的行为尽可能相 近的行为(IBM、GPFS、RS/600和SP是IBM公司在美国,其他 国家或两者的商标。Linux是Linus Torvalds在美国,其他国家或 两者的商标)。
群集的一个缺点是,程序必须分割,以在多台机器上运行。这些 被分割的程序难以协作或共享资源。也许最重要的一个资源是文件系 统。在没有群集文件系统的情况下,某些群集文件系统允许客户端节 点直接访问元数据,如与文件数据(分布式元数据)并排存储在数据 服务器上的目录和文件属性,并使用分布式锁定协议使更新与这些元 数据同步。诸如SAN-FS、Lustre和P-NFS之类的其他系统,使用 一个或多个专用的元数据服务器节点来处理元数据。群集文件系统与 传统文件服务器相比的优点是通过将数据分布在许多数据服务器上, 可以提供更高的聚合数据吞吐量。
当在群集上运行时,传统的超级计算应用需要从跨群集共享的文 件内的多个节点进行并行存取。其他应用,包括可扩展的文件和Web 服务器和大型数字图书馆,其特征通常是文件间的并行存取。在后一 类应用程序中,单个文件中的数据不一定被并行地访问。但是,由于 文件驻留在共同的目录中,并在相同的磁盘上分配空间,文件系统数 据结构(元数据)仍被并行地访问。在大型计算系统中,甚至诸如添 加磁盘或从文件系统中删除磁盘或跨磁盘重新平衡文件之类的管理 动作,也会涉及大量的工作。
群集文件系统的磁盘可以跨构成群集的某些或全部节点分布。
许多磁盘驱动系统都依赖于诸如小型计算机系统接口(SCSI) 总线之类的标准化的总线,来将主计算机连接到控制器,并连接控制 器和磁盘驱动器。SCSI是已经变得越来越普及地用于将计算机及其 他I/O设备互连在一起的通信协议标准。为此,SCSI在逻辑上是分 层的。这种分层允许软件接口保持相对不变,同时又能接纳基于串行 互连,如Fibre Channel和串行存储体系结构(SSA)的新的物理互 连方案。在ANSI X3.131-1986中描述了SCSI(SCSI-1)的第一个版 本。随着驱动器速度的加快和容量的增大,SCSI标准已经经过了许 多次修改。设计了SCSI-3规范,以进一步改善功能和接纳高速串 行传输接口。
当检测到节点故障时,人们不能确信该节点是不是在物理上损坏 了,或者是不是通信网络发生故障,使得该节点看起来像发生故障, 而事实上节点非常可能仍是有效的。因此,文件系统日志恢复必须延 迟足够长的时间,以确保在此时间点之后发生故障的节点将不能执行 任何I/O,直到可以肯定地确定发生故障的节点的状态。随着系统的 复杂性的增大,越来越不希望在磁盘驱动器级别或者在控制器级别发 生中断故障。结果,系统变得更加可靠。尽管如此,万一磁盘驱动系 统发生故障或离线,会对用户造成更大的不方便;尽管问题可以相对 来说快速地得到校正。
当在非并行模式下操作时,高可用性群集多处理可以使用SCSI 的Reserve/Release命令来控制对磁盘存储设备的访问。在美国专利 No.6,954,881中描述了使用SCSI-3Persistent Reserve命令通过多 路径对逻辑卷的共享的非并行访问,该专利以引用的方式并入本文 中。高可用性群集多处理提供了由于硬件或软件故障而将对磁盘存储 设备的访问的故障转移到另一个节点的方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880023511.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:向存储硬件的存储操作卸载
- 下一篇:利用事务存储器硬件来加速虚拟化和仿真