[发明专利]分布式数据存储系统中多维有序数据的存储方法有效
申请号: | 201610459969.4 | 申请日: | 2016-06-22 |
公开(公告)号: | CN105975634B | 公开(公告)日: | 2017-10-31 |
发明(设计)人: | 王建民;黄向东;张博;龙明盛 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F3/06 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 廖元秋 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式 数据 存储系统 多维 有序 存储 方法 | ||
技术领域
本发明属于计算机数据管理技术领域,特别涉及一种分布式数据存储系统中多维有序数据的存储方法。
背景技术
维度是组成现实世界事物的基本状态,随着对物理世界认知的加深,人们不再仅仅使用一个维度刻画事物,而是同时存储和使用多个维度对数据进行描述。多维有序数据是指某些维度具有顺序关系的数据集合,以这种数据为基础的应用广泛存在。例如,在气象预报中,用户需要使用预报模式、物理量类型、预报时刻、预报时效、地理高度等5个维度共同刻画一个气象预报数据,而在设备的传感监测中,至少需要设备ID、监测物理量类型、监测时刻等3个维度对监测数据进行描述。
新兴的分布式计算机数据存储系统(后文简称为分布式存储系统)在处理海量数据方面具有较强优势,以HBase、Cassandra为代表的基于Key-Value的分布式存储系统广泛应用于大数据场景。分布式存储系统实质是一个多维的分布式映射,一个分布式存储系统由n个节点组成,通过列族名(Column Family)、行键(Row Key)、列名(Column Name)唯一地映射到一个值(Value),数据会根据行键分布到不同的节点上。不同于传统数据库以严格的表结构存储数据,分布式存储系统的数据是以松散结构的多维哈希表存储在系统中,是一种面向行的存储;其弱化了表的结构,可以自由地向列族中添加数据。每一个列族都被设计为一组数据关联或排列。而且根据用户需求场景,还可以采用多种灵活的方式保存数据,而不必拘泥于早前定义的表结构。
面对新兴的分布式存储系统,多维有序数据的存储带来了新的问题:(1)多种维度如何存储在分布式存储系统中;(即进行合理的存储结构设计)(2)针对有序维度连续访问的特点,如何得到性能最优的存储方案。
目前工业界对分布式存储系统存储结构设计的讨论主要在于定性分析,而非定量计算,例如易趣(Ebay)的工程师在《Cassandra数据模型设计最佳实践》对存储结构设计提出了4项关键原则;《Cassandra:The Definitive Guide》一书也定性的分析了存储结构设计的原则。但这些原则都需要依赖于工程师的使用经验,不能通过定量计算来完成设计。
发明内容
本发明的目的是针对目前分布式存储系统,数据保存方式灵活,结构弱化,方案众多,但性能无法预先评测的问题,提出一种分布式数据存储系统中多维有序数据的存储方法。本发明基于对存储系统的原理分析,通过对有序数据的基本操作进行理论时间代价评估,最终得到一种期望性能最优的存储方案;该方案具备应对大数据的能力,且具有很强的适应性。
本发明提出一种分布式数据存储系统中多维有序数据的存储方法,包括以下步骤:
1)对待存储的由多个对象组成的多维数据进行定义,并将维度划分为有序维度集合与无序维度集合;
设O={o1,o2,...,os}为s个待存储对象组成的集合,Dim{D1,D2,...,Dk}为集合O中所有待存储对象维度集合,共有k个维度,s、k均为正整数;V为集合O中所有待存储对象数据值集合;
设M为有序维度集合,N为无序维度集合,M、N均为非负整数,则待存储对象组成的集合O表达为多维有序数据集合的形式,如式(1)所示:
SeqData(|o1,o2,...,os|,M,N,V)(1)
2)对基于步骤1)得到的多维有序数据集合的读取操作进行定义;
2-1)单元读取:对Di∈Dim,通过指定每一个维度的具体值Di=di,i=1,2,...k,进行数据读取的操作称为单元读取,定义单元读取操作为:Opread;
2-2)确定顺序近邻读取维度;对于有顺序近邻读取需求的维度Dtarget∈M,获取在该维度上的顺序近邻操作定义为:Opnext(Dtarget);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610459969.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:搜索结果排序方法和装置
- 下一篇:一种工业设计产品智能推荐方法及系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置