[发明专利]一种应用于分布式文件系统的文件副本异步写方法无效
申请号: | 201310552010.1 | 申请日: | 2013-11-08 |
公开(公告)号: | CN103546580A | 公开(公告)日: | 2014-01-29 |
发明(设计)人: | 陆月明;杨宇 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 分布式 文件系统 文件 副本 异步 方法 | ||
技术领域
本发明涉及一种应用于分布式文件系统的文件副本异步写方法,以提高分布式文件系统中写文件的速度,属于计算机科学与技术领域。
背景技术
随着云时代的到来,每天互联网上都会产生数以亿计的数据,这种数量级的数据已经远远超出了一台计算机的存储能力和处理能力。分布式存储系统因为具有海量数据存储、高扩展性、高性能、高可靠性、高可用性的特点,目前正被作为企业海量数据存储方案被业界所广泛讨论和应用。文件包含元数据和数据两部分。元数据包括文件名字、大小、访问权限和数据存储位置等属性信息。数据是真正的文件内容。分布式文件系统采用元数据和数据分离的存储方式,元数据服务器存放元数据,数据服务器机群存放数据。
分布式文件系统采用多文件副本的方式存储文件,即一个文件的数据拥有多个文件副本,分别存储在不同数据服务器里。当一台或多台数据服务器意外宕机时,这个文件的数据依然可用。多文件副本的方式大大提高了分布式文件系统的可靠性。当用户上传一个文件到分布式文件系统,只有数据服务器机群指定的数据服务器都成功写入了文件副本,才会向用户响应上传成功。数据服务器机群一般采用链式写文件副本的方法。如图1所示,用户向第一台数据服务器发送数据包,第一台数据服务器先把数据包转发给下一台数据服务器,再写数据到本地硬盘,然后等待下一台数据服务器的响应。之后的所有数据服务器都是如此,数据包逐个向后传。直到最后一台数据服务器写数据到硬盘后,创建写成功的响应包并发给上一台数据服务器。上一台数据服务器收到响应包并且自己已经写数据到硬盘,才能向上一台数据服务器发送写成功响应包。直到用户收到写成功的响应包,则本次写操作完成。
链式写副本的方式需要所有指定的数据服务器都把文件数据写入到本地硬盘,然后由最后一台数据服务器依次向前一台发送写成功的响应,直到数据服务器。如果有一台数据服务器写失败,则认为是本次写操作失败,这次写操作需要重新执行。虽然这种方式保证所有副本都可以成功写入数据服务器,但只是由于某个数据服务器写副本失败,就要重新写,代价太大。而且每个数据服务器都写数据到本地硬盘,使得写的速度很慢。
为了解决链式写文件副本方法的缺点,本发明提出的一种应用于分布式文件系统的文件副本异步写方法,保留了链式转发数据的方式,减少了数据服务器写数据的时延,提前发送写成功的响应,大大提高了写文件的速度。
发明内容
本发明“一种应用于分布式文件系统的文件副本异步写方法”包括五个模块组成。下面详细介绍一种应用于分布式文件系统的文件副本异步写方法和各个组成部分的内容。
(1)本发明构架
本发明“一种应用于分布式文件系统的文件副本异步写方法”,本发明形成的架构如图2所示,主要由元数据服务器和数据服务器两大部分组成。元数据服务器包括元数据和定时检查两个模块。数据服务器包括数据存储、写控制和数据服务器序号表三个模块。
(2)本发明的五个组成模块
本发明“一种应用于分布式文件系统的文件副本异步写方法”由五个模块组成,它由元数据、定时检查、数据存储、写控制和数据服务器序号表五模块组成。以下就各功能模块及其方法作详细说明。
●元数据模块:存放元数据的模块,元数据包括文件大小、创建时间、修改时间、访问权限和数据存放在哪台数据服务器等元数据信息。
●定时检查模块:每过一段时间,此模块根据元数据信息检查各个数据服务器上的数据是否存在、完整或是最新的数据。如果副本数不满足,则元数据服务器根据一定规则选择数据服务器创建副本,以满足用户要求。它是整个方法的“检查模块”,也是数据可靠性的重要保障。
●数据存储模块:存放真正的数据。
●写控制模块:先把网络接口中收到的数据读到内存,再把数据写到下一台数据服务器的网络接口,最后把内存中的数据写到本地磁盘。
●数据服务器序号表:记录了本次写操作过程中数据服务器的序号。根据自己是第几台数据服务器,决定是否要向前一台数据服务器或客户端发送写成功的响应包。第一台数据服务器保证数据写到硬盘才能发送写成功的响应包。第二台数据服务器保证数据写到内存即可发送写成功的响应包。其他数据服务器只需写数据到本地硬盘和转发数据包给下一台数据服务器,无需返回是否写成功的响应包。
(3)本发明各模块的执行流程
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310552010.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于医用电子直线加速器机械接口的B超图像定位装置
- 下一篇:创面治疗仪