[发明专利]一种云环境下基于重复数据的缓存方法有效
申请号: | 201610477673.5 | 申请日: | 2016-06-27 |
公开(公告)号: | CN106155934B | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 周可;王桦;饶琦 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F12/0891 | 分类号: | G06F12/0891 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种云环境下基于重复数据的缓存方法,属于计算机云存储技术领域。该方法将文件分为多个数据块,以数据块的方式加载于缓存中,重复的数据块只加载一次,由此提高缓存空间的利用率;进一步地,研究文件间的重复块的规律,提出一种基于重复比例考量的缓存替换方法,提高缓存命中率,最终提高缓存系统的效率。 | ||
搜索关键词: | 一种 环境 基于 重复 数据 缓存 方法 | ||
【主权项】:
1.一种云环境下基于重复数据的缓存方法,其特征在于,该方法包括以下步骤:1)记欲加载的文件为T;2)根据文件T的哈希值查询文件级哈希映射表以判定该文件是否已被缓存,若未缓存,则进入步骤3),否则结束;3)将文件T包含的数据块信息增加至元数据文件;4)将文件T中的数据块按照如下方式加载于内存中:41)将文件T的文件哈希值添加至文件级哈希映射表;42)根据文件哈希值找到该文件对应的元数据文件,元数据文件包括该文件的所有分块数据块信息;43)从元数据文件中读取某一数据块的哈希值;44)根据数据块哈希值在元数据属性表查询是否已缓存该数据块,若未缓存,则进入步骤45);若已缓存,然后继续读取下一数据块,返回步骤43),直到文件T的所有数据块处理完毕;45)将数据块加载于缓存中,在元数据属性表中添加新加载的数据块哈希值,其对应的引用次数初始化为1,然后继续读取下一数据块,返回步骤43),直到文件T的所有数据块处理完毕;在所述步骤45)之前,还判定缓存是否已满,若满,则从缓存中选取文件删除,将删除的文件哈希值从文件级哈希映射表移除,将删除文件涉及的数据块引用次数减1,如果引用次数为0,删除数据块,进入步骤45);若未满,直接进入步骤45);所述从缓存中选取文件删除的选取原则是:选取重复比例Dup最低的文件删除,所述重复比例定义为:统计文件中有多少个数据块与其它文件具有相同的数据块;用相同数据块的个数除以这个文件的数据块总数得到重复比例;在加载数据块的同时还构建:用于记录加载文件哈希值的文件级哈希映射表;用于记录加载的数据块哈希值、数据块大小、数据块在文件中的起始位置信息的元数据文件,元数据文件以文件哈希值命名;记录数据块哈希值和引用次数的元数据属性表;所述引用次数的定义为:缓存中某数据块被多个文件同时拥有,所涉及的文件总数被定义为该数据块的引用次数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610477673.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种同轴稀土铝合金电缆
- 下一篇:一种薄板形工件铣削辅助工装
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置