[发明专利]数据处理的方法及装置有效
申请号: | 201310386022.1 | 申请日: | 2013-08-29 |
公开(公告)号: | CN104424274B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 曾伟纪;李浩;武磊;蔡馥晗 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/2455 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 蒋雅洁;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 | ||
本发明公开了一种数据处理的方法及装置,涉及数据库应用技术领域,能够解决从原始数据中进行查询,计算代价高的问题。方法包括:接收用户输入的目标属性组合(view)集M*;从存储器中读取预设固化属性组合集;在预设固化属性组合集中选取至少一个预设固化属性组合中间属性组合集I*,I*和M*的并集(I*∪M*)中M*中各目标属性组合的计算代价的总和,小于M*中各属性组合的计算代价的总和;从存储器中读取I*∪M*对应的固化数据;在I*∪M*对应的固化数据中,对M*中各目标属性组合进行匹配查询,得到与M*相匹配的查询结果。本发明主要应用于多维数据分析的过程中。
技术领域
本发明涉及数据库应用技术领域,尤其涉及一种数据处理的方法及装置。
背景技术
随着数据库技术的发展和应用,数据库存储的数据量从20世纪80年代的兆(M)字节及千兆(G)字节过渡到现在的兆兆(T)字节和千兆兆(P)字节,同时,用户的查询需求也越来越复杂,涉及的已不仅是查询或操纵一张关系表中的一条或几条记录,而且要对多张表中千万条记录的数据进行数据分析和信息综合,关系数据库系统已不能全部满足这一要求,由此促成了联机分析处理(OLAP)的诞生。OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。在进行多维数据查询时,由多个属性(attribute)组成的查询条件称为属性组合(view)。从原始数据中查找出与一个或多个属性组合组成的属性组合集相对应的数据集合,并将这种对应关系进行保存的过程称为固化属性组合集。
现有技术在实现固化属性组合集时,根据属性组合集中的各个属性组合在原始数据中进行查询,得到与属性组合集相对应的数据集合。
在实现上述数据处理的过程中,发明人发现现有技术中至少存在如下问题:由于在多位数据查询中,涉及的较多的维度、属性,因此原始数据的数据量大。此时,从原始数据进行固化属性组合耗费的计算资源量大,计算代价高。
发明内容
本发明提供的一种数据处理的方法及装置,能够解决在固化属性组合集时,从原始数据中进行查询导致的,耗费的计算资源量大,计算代价高的问题。
一方面,本发明提供了一种数据处理的方法,包括:
接收用户输入的目标属性组合(view)集M*,其中,所述目标属性组合集由至少一个属性组合组成,用于表示用户需要查询的属性组合的集合;
从存储器中读取预设固化属性组合集;
在所述预设固化属性组合集中选取至少一个预设固化属性组合,所述至少一预设固化属性组合组成中间属性组合集I*,所述I*和M*的并集(I*∪M*)中M*中各目标属性组合的计算代价的总和,小于M*中各属性组合的计算代价的总和;
从所述存储器中读取所述I*∪M*对应的固化数据;
在所述I*∪M*对应的固化数据中,对M*中各目标属性组合进行匹配查询,得到与M*相匹配的查询结果。
另一方面,本发明实施例还提供了一种数据处理的装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310386022.1/2.html,转载请声明来源钻瓜专利网。