[发明专利]一种存储系统中关联块的快速挖掘方法有效

专利信息
申请号: 201711113802.3 申请日: 2017-11-13
公开(公告)号: CN107967306B 公开(公告)日: 2020-07-03
发明(设计)人: 谭支鹏;周炜;冯丹;徐高翔;张鑫 申请(专利权)人: 华中科技大学
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/2455
代理公司: 华中科技大学专利中心 42201 代理人: 廖盈春;李智
地址: 430074 湖北*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 存储系统 关联 快速 挖掘 方法
【说明书】:

发明公开了一种存储系统中关联块的快速挖掘方法,属于计算机信息存储领域。本发明首先将被频繁顺序访问的连续数据块识别出来,然后被频繁顺序访问的连续数据块组成一个频繁顺序访问数据区,简化原始的数据访问记录,采用关联数据块挖掘算法对简化后的数据访问记录进行挖掘,将挖掘出的频繁序列中的顺序访问连续数据区域替换为其所对应的各数据块,得到最终的关联块挖掘结果,通过大量减少关联数据块挖掘过程中顺序访问的频繁连续数据所需的时间和空间开销,本方法可以大幅提高存储系统中关联块的挖掘效率。

技术领域

本发明属于计算机信息存储领域,更具体地,涉及一种存储系统中关联块的快速挖掘方法。

背景技术

关联数据块在存储系统中有很大的研究价值,例如在预取一个数据块是将关联访问的数据块一起预取,后续请求的数据在缓存中命中则会提高响应速度,又例如将关联访问的数据块存放在存储设备的同一区域,访问这些关联的数据块时能达到更快的速度。

经典的关联块挖掘算法要消耗大量的计算和存储资源,现有方法在存储系统中往往以较低的频率进行关联块挖掘,对负载的变化响应不及时。尤其在大数据时代随着数据量的急剧增长,关联数据块挖掘的开销问题变得尤为明显。采用高效快速的关联块挖掘算法,是存储系统适应负载变化的关键,也是提高存储效率的关键。

存储系统中有很大部分的关联访问是由顺序访问请求产生的,例如一些较大的文件包含的多个数据块,这些数据块存放在一片连续的区域;或者多个连续访问的文件,它们的数据块存放在一片连续的空间。当这些文件被访问时,它们所包含的数据块也被顺序访问。现有关联块挖掘算法在历史访问记录中挖掘这些顺序访问的关联块时,需要消耗大量的计算时间和存储空间。减少关联块挖掘过程中对顺序访问数据块的挖掘开销,能够有效减少挖掘的整体开销,提高效率。

发明内容

针对现有技术的以上缺陷或改进需求,本发明提供了一种存储系统中关联块的快速挖掘方法,其目的在于首先将频繁顺序访问数据区识别出来,之后将每个频繁顺序访问数据区当作一个整体,简化访问记录,再采用关联数据块挖掘算法对简化后的访问记录进行挖掘,得到最终挖掘结果,由此解决现有的关联块挖掘算法效率不高的技术问题。

为实现上述目的,本发明提供了一种存储系统中关联块的快速挖掘方法,所述方法包括一下步骤:

(1)根据访问记录识别出所有被频繁顺序访问的连续数据块,所述被频繁顺序访问的连续数据块组成一个频繁顺序访问数据区;

(2)为每个频繁顺序访问数据区指定一个代号;

(3)在访问记录中,用所述代号替换对应频繁顺序访问数据区中的数据块,生成一个替换访问记录;

(4)对替换访问记录使用关联数据块挖掘算法挖掘关联数据块;所述关联数据块挖掘算法可采用prefixspan算法或clospan算法,优选clospan算法;

(5)在挖掘结果中,将代号替换回对应频繁顺序访问数据区的数据块,得到最终挖掘结果。

进一步地,所述访问记录记录了一段时间内存储系统收到的访问请求,每一个访问请求按时间先后顺序对应一条记录信息,记录信息包括但不限于被请求访问的数据块的地址。

进一步地,所述被频繁顺序访问的连续数据块是地址上连续的多个数据块,且所述多个数据块被顺序访问,访问次数大于访问阈值;所述访问阈值取值范围为[8~1024],优选32,访问阈值根据具体应用场景设定。

进一步地,所述步骤(1)具体包括一下步骤:

(11)遍历访问记录,记录每个数据块的访问次数和顺序访问次数,有请求访问数据块时,当前请求所访问的数据块的访问次数加1,并判断当前请求与上一个请求所访问的数据块地址是否连续,若连续,则将当前请求所访问的数据块的顺序访问次数加1,否则不增加;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711113802.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top