[发明专利]一种云环境下基于重复数据的缓存方法有效

专利信息
申请号: 201610477673.5 申请日: 2016-06-27
公开(公告)号: CN106155934B 公开(公告)日: 2019-08-09
发明(设计)人: 周可;王桦;饶琦 申请(专利权)人: 华中科技大学
主分类号: G06F12/0891 分类号: G06F12/0891
代理公司: 华中科技大学专利中心 42201 代理人: 李智
地址: 430074 湖北*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种云环境下基于重复数据的缓存方法,属于计算机云存储技术领域。该方法将文件分为多个数据块,以数据块的方式加载于缓存中,重复的数据块只加载一次,由此提高缓存空间的利用率;进一步地,研究文件间的重复块的规律,提出一种基于重复比例考量的缓存替换方法,提高缓存命中率,最终提高缓存系统的效率。
搜索关键词: 一种 环境 基于 重复 数据 缓存 方法
【主权项】:
1.一种云环境下基于重复数据的缓存方法,其特征在于,该方法包括以下步骤:1)记欲加载的文件为T;2)根据文件T的哈希值查询文件级哈希映射表以判定该文件是否已被缓存,若未缓存,则进入步骤3),否则结束;3)将文件T包含的数据块信息增加至元数据文件;4)将文件T中的数据块按照如下方式加载于内存中:41)将文件T的文件哈希值添加至文件级哈希映射表;42)根据文件哈希值找到该文件对应的元数据文件,元数据文件包括该文件的所有分块数据块信息;43)从元数据文件中读取某一数据块的哈希值;44)根据数据块哈希值在元数据属性表查询是否已缓存该数据块,若未缓存,则进入步骤45);若已缓存,然后继续读取下一数据块,返回步骤43),直到文件T的所有数据块处理完毕;45)将数据块加载于缓存中,在元数据属性表中添加新加载的数据块哈希值,其对应的引用次数初始化为1,然后继续读取下一数据块,返回步骤43),直到文件T的所有数据块处理完毕;在所述步骤45)之前,还判定缓存是否已满,若满,则从缓存中选取文件删除,将删除的文件哈希值从文件级哈希映射表移除,将删除文件涉及的数据块引用次数减1,如果引用次数为0,删除数据块,进入步骤45);若未满,直接进入步骤45);所述从缓存中选取文件删除的选取原则是:选取重复比例Dup最低的文件删除,所述重复比例定义为:统计文件中有多少个数据块与其它文件具有相同的数据块;用相同数据块的个数除以这个文件的数据块总数得到重复比例;在加载数据块的同时还构建:用于记录加载文件哈希值的文件级哈希映射表;用于记录加载的数据块哈希值、数据块大小、数据块在文件中的起始位置信息的元数据文件,元数据文件以文件哈希值命名;记录数据块哈希值和引用次数的元数据属性表;所述引用次数的定义为:缓存中某数据块被多个文件同时拥有,所涉及的文件总数被定义为该数据块的引用次数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610477673.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top