[发明专利]一种基于Hadoop的OLAP数据存储与查询方法有效

申请号：	201310330472.9	申请日：	2013-07-31
公开（公告）号：	CN103366015A	公开（公告）日：	2013-10-23
发明（设计）人：	宋爱波;宋爱美;李龙生	申请（专利权）人：	东南大学;山东科技大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	南京苏高专利商标事务所(普通合伙) 32204	代理人：	柏尚春
地址：	210096***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于Hadoop的OLAP海量数据的存储与查询方法，在数据存储上，首先定义了新的列文件存储格式HCFile，然后给出了基于HCFile的数据表存储方法，在该方案中，读取一列数据只需读取若干HCFile，无需访问其它列数据，I/O效率与按行存储相比大大提高；同时，添加一列数据只需添加新的文件，极易扩展。在聚集计算上，首先创建了基于倒排结构的数据索引，然后利用MapReduce实现了OLAP的基本聚集计算，包括求和、最大/最小值和计数等，其它聚集计算可由这些基本聚集计算实现，得益于高效的数据索引，聚集计算的性能显著提升。本发明与现有技术相比，不仅有效的提高了数据存储与查询的效率，而且节省了硬件资源，降低了时间和硬件成本，同时，运用更方便灵活。
搜索关键词：	一种基于 hadoop olap 数据存储查询方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于Hadoop的OLAP海量数据的存储与查询方法，其特征在于：包括步骤如下：步骤100：定义列文件存储格式为HCFile，使用HCFile格式，按列存储数据表；步骤200：构建基于倒排结构的数据索引；步骤300：在数据查询过程中，读取步骤200中构建的数据索引，利用MapReduce实现OLAP聚集计算。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东南大学;山东科技大学，未经东南大学;山东科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201310330472.9/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于Hadoop的OLAP数据存储与查询方法有效

专利文献下载