[发明专利]一种海量流数据的存储和读取的方法和系统在审

专利信息
申请号: 201911196972.1 申请日: 2019-11-29
公开(公告)号: CN111159176A 公开(公告)日: 2020-05-15
发明(设计)人: 么广忠;郭斯杰;熊劲 申请(专利权)人: 中国科学院计算技术研究所
主分类号: G06F16/22 分类号: G06F16/22;G06F16/27;G06F16/2458;G06F16/2455
代理公司: 北京泛华伟业知识产权代理有限公司 11280 代理人: 王勇
地址: 100190 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 海量 数据 存储 读取 方法 系统
【权利要求书】:

1.一种海量流数据的存储方法,包括:

接收来自客户端的流数据;

将所述流数据以行式格式存储到分布式段式存储系统,形成行式流数据;

将所述流数据以列式格式异步地存储到分布式段式存储系统,形成列式流数据;

所述行式流数据存储完成后向客户端返回确认消息。

2.根据权利要求1所述的方法,其中,所述将所述流数据以列式格式异步地存储到分布式段式存储系统,包括:

在将所述流数据以行式格式存储到存储系统的同时,将所述流数据以列式格式异步地存储到分布式段式存储系统,形成列式流数据。

3.根据权利要求1所述的方法,其中,所述将所述流数据以列式格式异步地存储到分布式段式存储系统,包括:

先将所述流数据以行式格式存储到分布式段式存储系统,形成行式流数据;

从所述分布式段式存储系统中读取所述行式流数据,将所述行式流数据以列式格式异步地存储到分布式段式存储系统,形成列式流数据。

4.根据权利要求1所述的方法,其中,所述将所述流数据以列式格式异步地存储到分布式段式存储系统,包括:

提取所述流数据的数据模式;

根据所述数据模式将所述流数据按列进行组织;

为所述按列组织的流数据中的每一列簇分别开辟一个缓冲区;

将所述按列组织的流数据按照列簇分别添加至与所述列簇对应的缓冲区的末尾空位;

当所述缓冲区已满时,将所述缓冲区内的流数据写入所述分布式段式存储系统,不同列簇的流数据存储在不同的段中。

5.根据权利要求4所述的方法,还包括:

为所述流数据中每个事件设定一个ID;

记录所述缓冲区内每个事件的位置信息;

当所述缓冲区已满时,将所述缓冲区内所有事件的ID及对应的位置信息附于所述缓冲区头部;

将所述缓冲区内所有事件的ID及位置信息连同所述缓冲区内的所有流数据一起写入所述分布式段式存储系统的数据单元内,所述缓冲区内所有事件的ID及位置信息位于所述数据单元的头部。

6.根据权利要求1所述的方法,还包括:

将所述列式流数据的元数据存储到分布式键值存储系统,所述元数据包括流和段两个级别,其中,

所述流级别的元数据包括:构成所述列式流数据的列簇的信息、存储所述列簇的段的信息;

所述段级别的元数据包括:所述段内起止事件的位置信息、事件数目、最大值和最小值以及其他相关信息。

7.根据权利要求1所述的方法,还包括:

将所述流数据以列式格式异步地存储到分布式段式存储系统后,若在预定的时间阈值内未接收到读取所述行式流数据的请求时,将所述行式流数据从所述分布式段式存储系统中删除。

8.一种基于权利要求6所述的存储方法进行的海量流数据的读取方法,包括:

接收客户端读取数据的请求;

根据所述读取数据的请求在所述分布式键值存储系统中的查询所述数据的元数据;

根据所述元数据从所述分布式段式存储系统中读取所述数据并返回客户端。

9.根据权利要求8所述的读取方法,还包括:

根据所述数据的元数据确定所述数据的起始位置信息;

提前读取所述数据起始位置后的数据并置入数据缓存区;

从所述数据缓存区内读取所述数据。

10.一种用于海量流数据的存储系统,包括服务器和存储设备,能够用于实现权利要求1-9中任一所述的方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911196972.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top