[发明专利]一种基于HDFS大数据存储的数据编辑方法在审
申请号: | 202111239198.5 | 申请日: | 2021-10-25 |
公开(公告)号: | CN114003563A | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 胡浩瀚;郭正雄;王汝英;张立;杨少春;张海涛;朱传晶;刘德强;张志陶 | 申请(专利权)人: | 天津市普迅电力信息技术有限公司;国网信息通信产业集团有限公司 |
主分类号: | G06F16/14 | 分类号: | G06F16/14;G06F16/172;G06F16/178;G06F16/182 |
代理公司: | 天津盛理知识产权代理有限公司 12209 | 代理人: | 董一宁 |
地址: | 300384 天津市滨海新区华苑产*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 hdfs 数据 存储 编辑 方法 | ||
一种基于HDFS大数据存储的数据编辑方法,包括以下步骤:步骤一:配置存储策略、同步策略及数据合并策略;步骤二:数据接收服务根据存储策略将近一段时间内的数据存储在热数据存储内存及磁盘中;步骤三:数据同步服务根据同步策略以及数据是否为更新操作将热存储中的数据分别同步到分布式存储中的不同存储空间;步骤四:数据合并服务根据数据合并策略将分布式存储中两个存储空间的数据进行数据合并;步骤五:数据查询服务查询数据须先查询热存储,命中则返回,否则分别查询分布式存储两个存储空间,合并并返回查询结果。该方法实现了HDFS存储中的数据可更新功能,同时热存储中的数据提升访问效率。
技术领域
本发明涉及大数据存储技术领域,具体为一种基于HDFS大数据存储的数据编辑方法。
背景技术
HadoopDistributedFileSystem,简称HDFS,是一个分布式文件系统。HDFS有着高容错性(fault-tolerent)的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高吞吐量(highthroughput)来访问应用程序的数据,适合那些有着超大数据集(largedataset)的应用程序。非常多的非关系型数据库(NoSQL)底层存储采用HDFS,它们支持超大数据量存储、快速访问及数据分析,但它们中大多数并不支持数据更新操作。
发明内容
本发明的目的在于克服现有技术的不足之处,提供一种基于HDFS大数据存储的数据编辑方法,该方法实现了HDFS存储中的数据可更新功能,同时热存储中的数据提升访问效率。
一种基于HDFS大数据存储的数据编辑方法,包括以下步骤:
步骤一:配置存储策略、同步策略及数据合并策略;
步骤二:数据接收服务根据存储策略将近一段时间内的数据存储在热数据存储内存及磁盘中;
步骤三:数据同步服务根据同步策略以及数据是否为更新操作将热存储中的数据分别同步到分布式存储中的不同存储空间;
步骤四:数据合并服务根据数据合并策略将分布式存储中两个存储空间的数据进行数据合并;
步骤五:数据查询服务查询数据须先查询热存储,命中则返回,否则分别查询分布式存储两个存储空间,合并并返回查询结果。
而且,步骤一中的配置存储策略、同步策略及数据合并策略具体包括:
(1)配置存储策略以确定热存储中可存储的数据量,可选择时间式存储策略或空间式存储策略;时间式存储策略规定一定时间范围内的数据存储在热存储中;空间式存储策略规定一定数据量内的数据存储在热存储中;
(2)配置同步策略以确定热存储中的数据以何种方式同步至分布式文件存储HDFS中;可选择百分比同步策略或全量同步策略;百分比同步策略将热存储中一定百分比的数据量同步至分布式文件存储中;全量同步策略将热存储中全量数据同步至分布式文件存储中;
(3)配置数据合并策略以确定分布式存储中更新数据与旧数据合并操作的触发方式,可选择定时式策略或定量式策略;定时式策略规定数据合并操作在指定时间触发;定量式策略规定数据合并操作在更新数据达到一定数量时触发。
而且,步骤二包括以下子步骤:
(1)数据接收服务接收数据插入或数据更新请求,并将数据存入热存储空间;
(2)热存储空间分为插入数据存储空间和更新数据存储空间,插入数据存储空间用以存储新增请求的数据,更新数据存储空间用以存储更新请求的数据;
(3)对于新增数据请求,将数据存储在热存储中的插入数据存储空间;对于更新数据请求,将数据存储在热存储中的更新数据存储空间。
而且,步骤三中包括以下子步骤:
(1)数据同步服务定时启动,读取热存储数据,同步至分布式存储;
(2)分布式存储中分为数据存储空间和待更新数据存储空间;数据存储空间存储合并后数据,待更新数据存储空间存储待更新数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津市普迅电力信息技术有限公司;国网信息通信产业集团有限公司,未经天津市普迅电力信息技术有限公司;国网信息通信产业集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111239198.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置