[发明专利]虚拟化环境中的数据去重复有效
| 申请号: | 201110436633.3 | 申请日: | 2011-12-13 |
| 公开(公告)号: | CN102591592B | 公开(公告)日: | 2017-05-24 |
| 发明(设计)人: | R·卡拉赫;P·A·奥尔泰安;C·G·特奥多雷斯库;M·J·迪克森 | 申请(专利权)人: | 微软技术许可有限责任公司 |
| 主分类号: | G06F3/06 | 分类号: | G06F3/06 |
| 代理公司: | 上海专利商标事务所有限公司31100 | 代理人: | 罗婷婷 |
| 地址: | 美国华*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 虚拟 环境 中的 数据 重复 | ||
技术领域
本发明涉及数据优化技术,尤其涉及在虚拟化环境中进行数据去重复的方法和系统。
背景技术
数据去重复,也称为数据优化,是在不损害原始数据的保真性或完整性的情况下,减少需要存储在盘上或需要通过网络来进行传送的数据的物理字节量的动作。数据去重复减少了存储数据所需的存储容量,并且可因此导致存储硬件成本和数据管理成本方面的节省。数据去重复提供了用于处理快速增长的数字化存储的数据的解决方案。
数据去重复可根据用于消除各持久存储文件之内或之间的重复的一项或多项技术来执行。例如,根据一项技术,在一个或多个文件中出现多次的唯一数据区域可被标识,并且这些所标识的唯一数据区域的单一副本可被物理地存储。可存储对这些所标识的唯一数据区域(也称为数据“块”)的引用,引用指示了包含这些唯一数据区域的各文件以及在这些文件中的位置。该技术一般称为单一实例化。除了单一实例化以外,还可执行对数据的压缩。其他数据减少技术也可被实现为数据去重复解决方案的一部分。
在本说明书中,经优化的数据指已由诸如块的单一实例化和压缩之类的一种或多种数据去重复技术进行了优化或者去重复的数据。经优化的流指被去重复后的流,或换言之,它们的数据已使用数据去重复技术来优化。
一旦数据被优化,就可以通过逆转优化效果(即对经优化的数据进行解优化)来访问数据,例如通过执行关于经优化的数据的逆去重操作和/或解压缩操作。然而,解优化导致了关于访问数据的延迟。更大的数据量导致更长的等待时间。此外,每次访问数据时这种等待时间都可能发生,除非在存储设备上存储用于访问的数据的解优化版本。另外,解优化通常消耗设备的大量资源(例如存储器、中央处理单元(CPU)、磁盘I/O等),这可能负面地影响正在该设备上运行的主工作负载。因此,频繁的解优化可能导致对设备资源的相对低效率的利用。
存储虚拟化是抽象出物理存储中的逻辑存储的动作,使得可经由逻辑存储来访问存储到该物理存储中的数据,而不考虑该物理存储的结构。例如,主机设备可执行一个或多个虚拟机实例。根据这个示例,主机设备可对虚拟机实例的盘进行仿真。经仿真的盘被存储成主机设备的物理存储上的文件。在另一个示例中,主机设备可执行用于将虚拟盘呈现给主机设备的操作系统的驱动器。根据这个示例,虚拟盘是通过安装存储在主机设备的物理存储上的文件来呈现的。被安装来对盘进行仿真(即,呈现虚拟盘)的文件被称为虚拟化存储文件。
利用数据优化的系统可被表征为具有相对较低的硬件(例如,存储)成本和/或相对较低的数据管理(例如,备份)成本。然而,当在虚拟化环境中执行数据优化时通常会引起问题。例如,如果虚拟化存储文件中的数据被完全优化,则与访问数据相关联的等待时间可以不恰当地使主机设备的性能降级,这在虚拟化存储文件的区域被频繁访问时尤其严重。在另一实例中,由于存储在虚拟盘中的一些文件的敏感性和/或这些文件所包括的数据的类型而对这些文件进行优化可能是不想要的。在非虚拟化环境中,这个问题可通过应用基于这些文件的策略来得到解决。然而,在虚拟化环境中,这些文件位于虚拟化存储文件中,并且因此并不对主机设备可见。主机设备一般无法知晓是否虚拟化存储文件的区域是不可优化的。
发明内容
在此描述了用于对虚拟化环境中的数据进行优化(即,去重复)等的各种方法。例如,可将优化标记(又名,去重复标记)分配给虚拟化存储文件的相应区域或分配给包括在作为安装虚拟化存储文件的结果来提供的虚拟盘中的相应宿主文件。虚拟化存储文件是被配置为要作为提供用于访问宿主文件的文件系统接口的盘或卷来安装的文件。根据这个示例,每一优化标记指示了相应区域或相应宿主文件要被优化(即,被去重复)到的程度。
还描述了用于安装虚拟化存储文件来提供包括多个宿主文件的虚拟盘的示例方法。每一宿主文件被映射至虚拟化存储文件的一个或多个区域。基于被映射至每一区域的宿主文件的至少一个属性来将优化标记分配给该区域。每一优化标记指示相应区域要被优化到的程度。每一区域被优化到由被分配给该区域的相应优化标记所指示的程度。
还描述了用于安装虚拟化存储文件来提供包括宿主文件的虚拟盘的另一示例方法。优化标记被分配给相应宿主文件。基于相应宿主文件的至少一个属性来将每一优化标记分配给该宿主文件。每一优化标记指示相应宿主文件要被优化到的程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110436633.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





