[发明专利]基于Hbase数据库的数据写入方法及装置有效
申请号: | 201611047256.3 | 申请日: | 2016-11-23 |
公开(公告)号: | CN106776795B | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 黄健文;王刚 | 申请(专利权)人: | 黄健文;王刚 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 深圳市恒申知识产权事务所(普通合伙) 44312 | 代理人: | 王利彬 |
地址: | 510000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 hbase 数据库 数据 写入 方法 装置 | ||
本发明公开了一种基于Hbase数据库的数据写入方法及装置,该方法包括:将该获取的线程的识别码和该生成的行主键列表作为基准数据,将该缓存内存中存储的数据记录、该存储的数据记录对应的行主键值、存储的线程的识别码和存储的行主键列表写入该数据库中的分布式文件系统中,并在写入完成后,将存储于该缓存内存中的线程的识别码和行主键列表作为待比对数据,将该基准数据与该待比对数据进行比对,若比对结果为存在有数据记录未写入该数据库的分布式文件系统中,则重新将该待写入文件写入该数据库中,这样确保数据存储的完整性,同时相比于以日志文件的方式记录,本发明利用行主键列表来比对,占用系统资源很小,进而不会影响数据存储效率。
技术领域
本发明属于数据存储领域,尤其涉及一种基于Hbase数据库的数据写入方法及装置。
背景技术
目前云存储系统多采取分布式存储的方法,将数据分散存储在多台独立的设备上,一方面完善了数据库的性能,提高了数据的读取效率;另一方面由于分布式存储结构,在有存储设备故障发生时,只会影响局部数据的存取,而不会使整个数据库瘫痪,进而增加了大数据的安全性和可靠性。Hadoop数据库(HBase,Hadoop Database)是一种分布式存储系统。虽然HBase数据库可以避免在存储设备发送故障时,不会影响数据库中全部数据的存取,但是无法避免在数据写入过程中产生故障,进而导致无法通过索引查询到目标数据。
现有技术中,预写式日志WAL(Write Ahead Logging)是确保数据完整性的标准方法。在数据库崩溃的情况下,通过WAL预先存储的日志来恢复数据库。预先存储的日志需要记录每一次的存储过程,故日志会占用系统大量存储资源,同时占用系统的I/O资源,一旦存储的数据量增多,必会降低数据存储的效率。
发明内容
本发明提供一种基于Hbase数据库的数据写入方法及装置,旨在解决因现有技术中预先存储的日志占用系统大量资源而导致降低数据存储效率的问题。
本发明提供的一种基于Hbase数据库的数据写入方法,包括:从线程中获取待写入文件对应的数据记录、所述数据记录对应的行主键值以及所述线程的识别码,并生成包含有所述数据记录与所述行主键值之间的对应关系的行主键列表,同时将所述获取的线程的识别码和所述生成的行主键列表作为基准数据;将所述获取的数据记录、所述获取的数据记录对应的行主键值、所述获取的线程的识别码和所述生成的行主键列表写入数据库中的缓存内存中;将所述缓存内存中存储的数据记录、所述存储的数据记录对应的行主键值、存储的线程的识别码和存储的行主键列表写入所述数据库中的分布式文件系统中,并在写入完成后,将存储于所述缓存内存中的线程的识别码和行主键列表作为待比对数据;将所述基准数据与所述待比对数据进行比对,若比对结果为存在有数据记录未写入所述数据库的分布式文件系统中,则重新将所述待写入文件写入所述数据库中。
本发明提供的一种基于Hbase数据库的数据写入装置,包括:获取模块,用于从线程中获取待写入文件对应的数据记录、所述数据记录对应的行主键值以及所述线程的识别码,并生成包含有所述数据记录与所述行主键值之间的对应关系的行主键列表,同时将所述获取的线程的识别码和所述生成的行主键列表作为基准数据;处理模块,用于将所述获取的数据记录、所述获取的数据记录对应的行主键值、所述获取的线程的识别码和所述生成的行主键列表写入数据库中的缓存内存中;所述处理模块,还用于将所述缓存内存中存储的数据记录、所述存储的数据记录对应的行主键值、存储的线程的识别码和存储的行主键列表写入所述数据库中的分布式文件系统中,并在写入完成后,将存储于所述缓存内存中的线程的识别码和行主键列表作为待比对数据;所述处理模块,还用于将所述基准数据与所述待比对数据进行比对,若比对结果为存在有数据记录未写入所述数据库的分布式文件系统中,则重新将所述待写入文件写入所述数据库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黄健文;王刚,未经黄健文;王刚许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611047256.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置