[发明专利]数据快照的数据结构、相关数据处理方法及装置和系统在审
申请号: | 202010243039.1 | 申请日: | 2020-03-31 |
公开(公告)号: | CN113468105A | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 张军伟;刘振军;陈森;王利虎 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/11 | 分类号: | G06F16/11;G06F11/14;G06F16/18 |
代理公司: | 北京思格颂知识产权代理有限公司 11635 | 代理人: | 杨超 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 快照 数据结构 相关 数据处理 方法 装置 系统 | ||
本发明公开了一种数据快照的数据结构、相关数据处理方法及装置和系统,该数据快照的数据结构,包括主数据和元数据;所述元数据中包括主数据的数据块标识和对应的有效位图;所述有效位图中每个比特位对应数据块中的一个子数据块,每个比特位中包括对应子数据块的数据有效性标识。可以应用于大粒度数据分配场景下,在ROW方式下进行数据快照处理时,解决了小粒度数据写入时带来的数据量放大的弊端,并且影响系统的IO访问性能的问题;在读取数据时,避免了数据读取时的IO放大开销,数据读取速度快,降低了对访问性能的影响;在删除快照版本时,支持异步数据资源释放,降低了对IO访问性能的影响。
技术领域
本发明涉及数据快照技术领域,特别涉及一种数据快照的数据结构、相关数据处理方法及装置和系统。
背景技术
快照(snapshot)是保留文件系统在某一时间点的一致数据的镜像。在不同时间点为一个文件系统创建的不同的快照版本,可以形成一条快照版本链。快照数据不会被修改,可保证备份数据过程中的数据一致,而当存储设备发生应用故障或者文件损坏时可以进行快速的数据恢复,将数据回滚恢复某个可用的时间点的状态,所以快照技术广泛用于数据备份和异常故障后恢复。
现有技术中,快照通常采用写时重定向(Redirect On Write,ROW)和写时拷贝(Copy On Write,COW)两种方式实现。参照图1所示,采用COW方式写数据时,为只读快照版本分配新的数据资源(本发明实施例中称为新分配数据块)把只读快照版本的数据块中的快照数据拷贝到当前可写快照版本的新分配数据块中,再修改只读快照版本的元数据,最后用新写入数据修改已拷贝到新分配数据块中的快照数据。由此可以看出采用COW方式,需要包含两次写入数据,读写数据量大,严重影响了系统的输入/输出(Input/Output,IO)访问性能。参照图2所示,采用ROW方式写数据时,为当前可写快照版本分配一个新分配数据块,并把新写入数据拷贝到新分配数据块中,从而保留只读快照版本的数据块中的快照数据不被修改。数据写入时,只包含一次数据修改,读写数据量小,对系统IO访问性能影响小,因此现有技术中通常采用ROW方式进行快照数据处理。在ROW方式实现快照数据处理时,快照的数据块的分配粒度可配置,比如128KB、1MB,在一些文件系统中设置大的数据块分配粒度,这样可带来一定的好处,比如可降低资源管理的开销,降低文件系统的元数据的数量,从而可以实现把文件系统元数据全部装载到服务器的内部存储器,以优化访问性能,但是大粒度的数据块本身的数据量很大,因此也会影响到系统的IO性能。在此基础上进行改进,采用小粒度数据(比如4KB)进行数据写入,为支持快照机制,防止将快照数据块中的原有数据覆盖,在写入小粒度数据时,也需要先读取只读快照版本的数据块中原有的快照数据,再将小粒度数据合并到该原有快照数据中,最后把修改后的大粒度的数据写入新分配数据块中。这种先读取快照版本中原有的快照数据,再进行数据合并的方式,依然存在读写数据量放大的问题,影响系统的IO访问性能。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种数据快照的数据结构、相关数据处理方法及装置和系统。
作为本发明实施例的第一个方面,本发明实施例提供一种数据快照的数据结构,包括主数据和元数据;
所述元数据中包括主数据的数据块标识和对应的有效位图;
所述有效位图中每个比特位对应数据块中的一个子数据块,每个比特位中包括对应子数据块的数据有效性标识。
作为本发明实施例的第二个方面,本发明实施例提供一种快照创建方法,包括:
固化当前可写快照版本的主数据的数据块和元数据,作为最新的只读快照版本;
复制最新的只读快照版本的元数据作为新的可写快照版本的元数据,并修改块引用计数表中主数据的数据块的引用计数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010243039.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置