[发明专利]一种堆叠式重复数据删除文件系统在审

专利信息
申请号: 201310541623.5 申请日: 2013-11-05
公开(公告)号: CN103617177A 公开(公告)日: 2014-03-05
发明(设计)人: 王恩东;文中领;张立强;孟圣智 申请(专利权)人: 浪潮(北京)电子信息产业有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京安信方达知识产权代理有限公司 11262 代理人: 王丹;栗若木
地址: 100085 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 堆叠 重复 数据 删除 文件系统
【说明书】:

技术领域

本发明涉及计算机存储领域,具体涉及一种基于堆叠式文件系统技术实现的重复数据删除文件系统。

背景技术

在大型存储系统中,数据急速增长与存储设备升级相对缓慢的矛盾较为尖锐,为了缓解存储系统的空间增长问题,缩减数据占用的空间,降低成本,最大化利用已有资源,重复数据删除技术已经成为大型系统中必不可少的关键技术。

通过使用重复数据删除技术,用户可以获得明显的数据缩减效果,可以大大降低存储系统的带宽需求,降低运营成本和维护成本。通过数据缩减使得后端实际的存储容量大大缩减,由此带来了更简洁的存储管理,有效降低了管理成本。

然而目前流行的重复数据删除方案,多为面向近线存储和备份存储的重删方案,而且往往与备份系统紧密结合,因而无法提供一般性的文件系统服务。能够在在线系统中直接提供重复数据删除功能的产品较少,且均需要使用专有的文件系统格式,这些专有的文件系统往往在性能、功能、可靠性、可扩展性方面均存在诸多限制,使得在大型在线存储系统中直接应用存在一定困难。

已有的大型存储系统往往基于成熟的文件系统构建,如ext3、ext4、xfs、lustre等,这类文件系统本身并不具备重复数据删除的功能,而如果要使用重复数据删除功能,则面临着需要使用专有的文件系统,忍受明显可感知的性能降低,并进行大规模的数据迁移,这带来极高的时间和空间成本,在已经有大量数据的存储系统中,基本上没有可行性,成本过高。

针对这一现状,本发明设计了一种堆叠式重复数据删除文件系统,能够基于已有的成熟的文件系统提供重复数据删除功能,充分保持原有存储系统的性能,同时几乎不需要进行任何数据迁移。

发明内容

本发明设计并实现了一种堆叠式重复数据删除文件系统,能够充分利用已有存储系统的存储能力,无需升级硬件最大限度地节省投资,通过堆叠式的软件设计,在已有的文件系统上提供重复数据删除功能,优化数据存储结构,降低存储系统的空间占用。

所述系统包括:

文件系统服务模块,对于正常的数据,采用直接接口转换的方式将底层文件系统的数据导入本文件系统中;对于进行了重复数据删除的数据,读取相应的数据属性标识,进行IO流程的重定向,实现重删后数据的透明无缝访问;

重删服务模块,读取文件系统服务模块导出的文件系统日志数据,解析日志内容后进行数据签名的计算、重复数据的检测和删除,完成重删后对数据进行标识。

本发明的有益效果是:基于堆叠式文件系统的设计可以充分利用现有的存储系统,仅通过安装本专利描述的软件系统即可使已有的文件系统支持重复数据删除功能以节省存储空间,无需迁移数据,同时保持了原有存储系统的IO性能,实现充分的设备利旧和投资保护。

附图说明

附图1为本专利所提出的堆叠式重复数据删除文件系统的架构示意图。

具体实施方式

下面参照附图1,对本发明的内容以一个具体实例来描述实现这一体系结构的过程。

正如发明内容中所描述的,本发明体系结构主要包括:文件系统服务模块、重删服务模块。

文件系统服务模块实现了一个完整支持POSIX协议的文件系统,其采用了堆叠式文件系统的设计策略,通过在文件系统接口层的映射和重写,将底层文件系统的服务完整实现。对于正常的数据,本模块采用直接接口转换的方式将底层文件系统的数据导入本文件系统中,实现了正常数据的无缝访问。对于进行了重复数据删除的数据,本模块根据本发明所描述的文件系统的约定,读取相应的数据属性标识,进行IO流程的重定向,实现重删后数据的透明无缝访问。

重删服务模块在带外独立运行,其采用多线程设计,充分利用多核系统的并行计算能力,提供超高速的重复数据删除功能。本模块读取文件系统服务模块导出的文件系统日志数据,解析日志内容后进行数据签名的计算、重复数据的检测和删除,完成重删后对数据进行标识。本模块可与文件系统服务模块同时运行,通过文件系统服务模块内设计的细粒度锁,保证数据处理的原子性,提供可靠的并行数据处理能力。

在一个典型的配置环境里,文件系统服务模块、重删服务模块可作为一般应用软件安装到主机系统中。在进行了相关的软件配置后,可启动文件系统服务模块、重删服务模块,此时已经能够在主机上挂载本发明描述的文件系统,并能够进行数据访问。在一段时间的文件系统IO完成后,重删服务模块能够自动地进行数据签名的计算,并根据配置参数进行重复数据的检测和删除,并完成重删后数据的标记。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮(北京)电子信息产业有限公司,未经浪潮(北京)电子信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310541623.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top