[发明专利]一种Hadoop上面向范围查询的内存缓存方法有效
申请号: | 201410144808.7 | 申请日: | 2014-04-12 |
公开(公告)号: | CN103942289B | 公开(公告)日: | 2017-01-25 |
发明(设计)人: | 李先贤;葛微 | 申请(专利权)人: | 广西师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司45112 | 代理人: | 刘梅芳 |
地址: | 541004 广西壮*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种Hadoop上面向范围查询的内存缓存方法,包括如下步骤1)在Hadoop海量数据的查询属性上建立索引,将索引存放在HBase上;2)在HBase索引数据上建立内存分片缓存,选择频繁被访问的索引数据缓存在内存中,数据分片的划分在初始阶段采用固定长度等分方法,同时采用跳表(skiplist)组织众多的数据分片;3)根据数据查询记录命中数据,采用指数平滑方法衡量数据分片热度;4)更新内存缓存。本发明的优点是采用跳表和集合相结合的结构,在此结构上支持动态调整集合的分片边界,使数据分片自适应查询需求,提高热点数据分片的查询缓存命中率,降低查询访问磁盘的开销,从而大幅度提高范围查询的性能。 | ||
搜索关键词: | 一种 hadoop 面向 范围 查询 内存 缓存 方法 | ||
【主权项】:
一种Hadoop上面向范围查询的内存缓存方法,其特征是,包括如下步骤:1)在Hadoop海量数据的查询属性上建立索引,将索引存放在HBase上;2)在HBase索引数据上建立内存分片缓存,选择频繁被访问的索引数据缓存在内存中,数据分片的划分在初始阶段采用固定长度等分方法,同时采用跳表组织众多的数据分片;3)根据数据查询记录命中数据,采用指数平滑方法衡量数据分片热度;4)更新内存缓存;所述的更新内存缓存包括热数据分片和冷数据分片、数据分片的分裂和数据分片的合并调整;所述的数据分片的分裂是数据分片热度高于内存淘汰门限但低于分片分裂门限,将分片分成相等的K份,数据分片被继续分裂,直到分片大小达到下限或者分片热度已经高于分片分裂门限,停止分裂,K是可配置参数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范大学,未经广西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410144808.7/,转载请声明来源钻瓜专利网。