[发明专利]一种堆叠式重复数据删除文件系统在审
申请号: | 201310541623.5 | 申请日: | 2013-11-05 |
公开(公告)号: | CN103617177A | 公开(公告)日: | 2014-03-05 |
发明(设计)人: | 王恩东;文中领;张立强;孟圣智 | 申请(专利权)人: | 浪潮(北京)电子信息产业有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 王丹;栗若木 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 堆叠 重复 数据 删除 文件系统 | ||
技术领域
本发明涉及计算机存储领域,具体涉及一种基于堆叠式文件系统技术实现的重复数据删除文件系统。
背景技术
在大型存储系统中,数据急速增长与存储设备升级相对缓慢的矛盾较为尖锐,为了缓解存储系统的空间增长问题,缩减数据占用的空间,降低成本,最大化利用已有资源,重复数据删除技术已经成为大型系统中必不可少的关键技术。
通过使用重复数据删除技术,用户可以获得明显的数据缩减效果,可以大大降低存储系统的带宽需求,降低运营成本和维护成本。通过数据缩减使得后端实际的存储容量大大缩减,由此带来了更简洁的存储管理,有效降低了管理成本。
然而目前流行的重复数据删除方案,多为面向近线存储和备份存储的重删方案,而且往往与备份系统紧密结合,因而无法提供一般性的文件系统服务。能够在在线系统中直接提供重复数据删除功能的产品较少,且均需要使用专有的文件系统格式,这些专有的文件系统往往在性能、功能、可靠性、可扩展性方面均存在诸多限制,使得在大型在线存储系统中直接应用存在一定困难。
已有的大型存储系统往往基于成熟的文件系统构建,如ext3、ext4、xfs、lustre等,这类文件系统本身并不具备重复数据删除的功能,而如果要使用重复数据删除功能,则面临着需要使用专有的文件系统,忍受明显可感知的性能降低,并进行大规模的数据迁移,这带来极高的时间和空间成本,在已经有大量数据的存储系统中,基本上没有可行性,成本过高。
针对这一现状,本发明设计了一种堆叠式重复数据删除文件系统,能够基于已有的成熟的文件系统提供重复数据删除功能,充分保持原有存储系统的性能,同时几乎不需要进行任何数据迁移。
发明内容
本发明设计并实现了一种堆叠式重复数据删除文件系统,能够充分利用已有存储系统的存储能力,无需升级硬件最大限度地节省投资,通过堆叠式的软件设计,在已有的文件系统上提供重复数据删除功能,优化数据存储结构,降低存储系统的空间占用。
所述系统包括:
文件系统服务模块,对于正常的数据,采用直接接口转换的方式将底层文件系统的数据导入本文件系统中;对于进行了重复数据删除的数据,读取相应的数据属性标识,进行IO流程的重定向,实现重删后数据的透明无缝访问;
重删服务模块,读取文件系统服务模块导出的文件系统日志数据,解析日志内容后进行数据签名的计算、重复数据的检测和删除,完成重删后对数据进行标识。
本发明的有益效果是:基于堆叠式文件系统的设计可以充分利用现有的存储系统,仅通过安装本专利描述的软件系统即可使已有的文件系统支持重复数据删除功能以节省存储空间,无需迁移数据,同时保持了原有存储系统的IO性能,实现充分的设备利旧和投资保护。
附图说明
附图1为本专利所提出的堆叠式重复数据删除文件系统的架构示意图。
具体实施方式
下面参照附图1,对本发明的内容以一个具体实例来描述实现这一体系结构的过程。
正如发明内容中所描述的,本发明体系结构主要包括:文件系统服务模块、重删服务模块。
文件系统服务模块实现了一个完整支持POSIX协议的文件系统,其采用了堆叠式文件系统的设计策略,通过在文件系统接口层的映射和重写,将底层文件系统的服务完整实现。对于正常的数据,本模块采用直接接口转换的方式将底层文件系统的数据导入本文件系统中,实现了正常数据的无缝访问。对于进行了重复数据删除的数据,本模块根据本发明所描述的文件系统的约定,读取相应的数据属性标识,进行IO流程的重定向,实现重删后数据的透明无缝访问。
重删服务模块在带外独立运行,其采用多线程设计,充分利用多核系统的并行计算能力,提供超高速的重复数据删除功能。本模块读取文件系统服务模块导出的文件系统日志数据,解析日志内容后进行数据签名的计算、重复数据的检测和删除,完成重删后对数据进行标识。本模块可与文件系统服务模块同时运行,通过文件系统服务模块内设计的细粒度锁,保证数据处理的原子性,提供可靠的并行数据处理能力。
在一个典型的配置环境里,文件系统服务模块、重删服务模块可作为一般应用软件安装到主机系统中。在进行了相关的软件配置后,可启动文件系统服务模块、重删服务模块,此时已经能够在主机上挂载本发明描述的文件系统,并能够进行数据访问。在一段时间的文件系统IO完成后,重删服务模块能够自动地进行数据签名的计算,并根据配置参数进行重复数据的检测和删除,并完成重删后数据的标记。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮(北京)电子信息产业有限公司,未经浪潮(北京)电子信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310541623.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:方向盘发泡装置
- 下一篇:一种海绵发泡机上的倒料装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置