[发明专利]大规模高可靠的归档存储系统构建方法无效
申请号: | 200910044404.X | 申请日: | 2009-09-25 |
公开(公告)号: | CN101692227A | 公开(公告)日: | 2010-04-07 |
发明(设计)人: | 杜凯;王怀民;杨树强 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/08 |
代理公司: | 国防科技大学专利服务中心 43202 | 代理人: | 郭敏 |
地址: | 410073 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大规模 可靠 归档 存储系统 构建 方法 | ||
技术领域
本发明涉及计算机应用技术领域存储系统的构建方法,具体地说是一种基于计算机集群系统的,大规模高可靠的归档数据存储系统的构建方法。
背景技术
大规模归档数据存储应用涉及网络安全管理、网络搜索、通信、金融、科学实验等诸多领域。例如,在网络安全应用中,对网络通信的报文头信息进行实时存储、查询和分析是常见的网络安全管理手段,该类数据具有典型的写一次读多次的归档特性,且由于其持续产生,生成速度快(一个普通的Gbit的网络连接产生的报文数可达每秒10万,其数据速度达几十MB每秒),所以形成的系统规模较大。类似的应用还有:在网络搜索引擎,需要依据用户个人信息如以往搜索的习惯和关注点等,为其提供更符合其喜好的搜索结果;在电信行业中,日常电话通信过程会产生大量的通话详细信息,如通信双方的电话号码,通话开始时间和结束时间,通话双方的地点等。这类信息被广泛用于用户个人事后查询,运营商分析消费模式或发现盗打行为,以及公共安全部门侦查等用途。
出于以上原因,设计大规模归档存储系统成为本领域技术人员极为关注的问题。在大规模归档数据存储系统中,一方面由于规模庞大,导致存储节点数目大,从而系统故障率较高。例如,当单个磁盘的可用性是99.999%(年故障时间5分钟)时,由1000个、100个、10个该磁盘串联组成的系统的可用性分别为99%(年故障时间88小时),99.9%(年故障时间8.8小时),99.99%(年故障时间0.88小时)。另一方面由于磁盘容量和带宽增长 速度的失配,导致数据恢复速度相对下降,所以数据可靠性成为设计该类系统的一个关键问题。
当前构建大规模归档存储系统的方法主要包括两种。一是采用基于冗余磁盘阵列RAID或存储区域网络SAN等昂贵的存储设备来保证可靠性,该方法一方面成本较高,另一方面当系统规模较大时,即使故障率较低,但一旦出现故障,恢复时间也较长,因此这种方法目前用得较少。二是采用存储节点集群,同时为每个文件存储多个副本,所有副本对等或随机分布存储于集群中。当采用对等存储时,降低了故障率,但不能降低故障恢复时间,因为文件只能串行对等恢复,其恢复时间可能较长;当采用随机存储时,可以有效提高故障恢复时间,但需要设计合理的系统参数,平衡故障率和恢复时间,以优化系统数据可靠性,当前对此类存储模式优化研究尚不充分。因此,如何在系统规模和文件副本数目一定的条件下,优化设计系统参数,提高系统可靠性,是采用存储节点集群构建大规模归档存储系统必须解决的重要问题。
发明内容
本发明要解决的技术问题是基于归档数据的特点,提供一种大规模归档存储系统构建方法,提高归档存储系统的可靠性。
本发明的技术方案是:
首先采用文件多副本的分布式存储及并行恢复方法对大规模归档文件进行存储及恢复,然后依据文件的故障恢复过程建立Markov可靠性模型,求解该模型后获得使系统可靠性优化的系统参数值,最后利用这些参数值构建存储系统。
具体技术方案是:
第一步,采用文件多副本的分布式存储及并行恢复方法对大规模归档文件进行存储及恢复:
步骤1)构建由多个存储节点组成的存储集群,每个存储节点是包含磁盘,处理器,内存和网络接口的计算机,存储节点之间通过以太网互联。存储节点依次编号为0,1,2,...,N-1,N为存储节点的总数目。待存储的文件数目为p个,每个文件有K个副本,p和K均为正整数。
步骤2)将p*K个副本随机均匀地分布于N个存储节点上,存储节点编号使用[1,N]上均匀分布的随机函数g=random(),1≤g≤N,同时保证K个副本应分别存储在K个不同的存储节点上;
步骤3)当存储集群中多个存储节点出现故障时,多个存储节点按照故障恢复方法进行并发恢复。故障恢复方法是:当存储集群中某个存储节点出现故障时,针对该故障节点上的某个文件j,从存储集群中包含j的副本的除故障节点外的K-1个正常节点中选择一个作为源节点,选择除源节点和故障节点外的任意一个正常节点作为临时目标节点,将副本从源节点拷贝到临时目标节点上。采用这种方法可将该故障节点上的所有文件存储到一组临时目标节点上,从而保持这组文件的副本数目不变。
步骤4)替换节点:当故障节点修复或被新节点替换后,将临时目标节点上的副本拷贝到该修复或替换后的新节点上,之后删除临时目标节点上的副本。
第二步,设计连续时间的Markov模型来描述大规模归档存储系统的故障恢复过程:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910044404.X/2.html,转载请声明来源钻瓜专利网。