[发明专利]面向商品筛选应用的分布式结构化数据存储及查询方法有效
申请号: | 201610488396.8 | 申请日: | 2016-06-28 |
公开(公告)号: | CN106202209B | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 张伟;徐丰 | 申请(专利权)人: | 北京信息科技大学;张伟;徐丰 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/182 |
代理公司: | 北京远创理想知识产权代理事务所(普通合伙) 11513 | 代理人: | 卫安乐 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种面向商品筛选应用的分布式结构化数据存储及查询技术,该技术包括:根据对数据表的历史查询数据进行统计分析,确定数据表的关键列集合,所述数据表的关键列集合包括N个高频或核心字段,其中N>1;根据关键列的数据相关性将关键列的取值划分为M个取值区间,其中M>1,同时将存储节点也划分成M个区域,并将M个关键列的取值区间划分到上述的M个区域内,上述区域内包括至少一个存储节点;将所述数据表中的数据根据其关键列及取值划分到对应的存储区域,并将该数据存储到对应的存储区域。 | ||
搜索关键词: | 面向 商品 筛选 应用 分布式 结构 数据 存储 查询 方法 | ||
【主权项】:
1.一种面向商品筛选应用的分布式结构化数据存储及查询方法,其特征在于,包括:步骤1、根据对数据表的历史查询数据进行统计分析,确定数据表的关键列集合,所述数据表的关键列集合包括N个高频或核心字段,其中N>1;根据关键列的数据相关性将关键列的取值划分为M个取值区间,其中M>1,同时将存储节点也划分成M个区域,并将M个关键列的取值区间划分到上述的M个区域内,上述区域内包括至少一个存储节点;步骤2、将所述数据表中的数据根据其关键列及取值划分到对应的存储区域,并将该数据存储到对应的存储区域;步骤3、在系统处理查询请求时接收到查询条件时,根据查询条件中已有的关键列信息,在预设的存储区域中进行查询;其中所述步骤2中是根据各存储区域中关键列取值范围,将数据表中数据划分到各存储区域内;具体包括:步骤21、对于数据表中的任意记录,获取该条记录中所有关键列的K(x,y);K(x,y)表示某条数据记录中第x关键列的取值所属第y区域;并统计每个存储区域内y的数量;步骤22、判断是否在某个取值区间具有唯一最大值个y时,如果是则直接将该记录存储到该存储区域中;如果y不存在唯一最大值,则根据存储负载均衡,将该记录存储到数据量较少的存储区域中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学;张伟;徐丰,未经北京信息科技大学;张伟;徐丰许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610488396.8/,转载请声明来源钻瓜专利网。