[发明专利]基于Hbase数据库的倒排索引混合压缩及解压方法无效
申请号: | 201210147725.4 | 申请日: | 2012-05-14 |
公开(公告)号: | CN102708187A | 公开(公告)日: | 2012-10-03 |
发明(设计)人: | 安俊秀;程芃森 | 申请(专利权)人: | 成都信息工程学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京中海智圣知识产权代理有限公司 11282 | 代理人: | 巢瑞钰 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于Hbase数据库的倒排索引混合压缩方法,包括以下步骤:对Hbase数据库进行处理得到内容包括键和值的Hbase数据库倒排索引数据表;对键部分采用键既字典压缩法进行压缩;对值部分采用可变字节码压缩法进行压缩;将压缩后的内容写入文件。本发明还公开了一种采用上述压缩方法压缩后的压缩文件键部分的解压方法,对每一条压缩数据的长度进行判断,根据以下两种情况分别处理并获得解压数据:1、长度小于或等于13,2、长度大于或等于25,否则解压失败。本发明采用分类混合压缩方法及分类解压法,在尽量保证高解压率的前提下提高压缩比,实现文件读取和数据解压的统一考量,在整体上提高倒排索引的查询效率并节省存储空间。 | ||
搜索关键词: | 基于 hbase 数据库 索引 混合 压缩 解压 方法 | ||
【主权项】:
一种基于Hbase数据库的倒排索引混合压缩方法,其特征在于:包括以下步骤:(1)对所述Hbase数据库进行倒排索引处理得到Hbase数据库倒排索引数据表,所述Hbase数据库倒排索引数据表的内容包括键和值;(2)对所述Hbase数据库倒排索引数据表中的键部分采用键既字典压缩法进行压缩;(3)对所述Hbase数据库倒排索引数据表中的值部分采用可变字节码压缩法进行压缩;(4)将压缩后的内容写入文件。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都信息工程学院,未经成都信息工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210147725.4/,转载请声明来源钻瓜专利网。