[发明专利]一种将业务数据更新至Hive的方法、终端及存储介质有效
申请号: | 201910899330.1 | 申请日: | 2019-09-23 |
公开(公告)号: | CN110647535B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 陈娟妮;胡清;王建华 | 申请(专利权)人: | 浪潮软件集团有限公司 |
主分类号: | G06F16/23 | 分类号: | G06F16/23;G06F16/27 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙园园 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 业务 数据 更新 hive 方法 终端 存储 介质 | ||
本发明公开了一种将业务数据更新至Hive的方法、终端及存储介质,属于业务数据存储领域,要解决的技术问题为如何实现Hive与业务表的对接、业务表数据的写入和更新以及大量业务表的处理。其方法包括:动态创建Hive事务表的JavaBean Class实例;构建映射关系Map;通过JavaBean实例将待更新的业务数据写入待更新的业务数据集、将待新增的业务数据写入待新增的业务数据集;将待更新的业务数据集存储至Hive事务表,将待新增的业务数据集添加Hive虚拟主键后存储至Hive事务表。终端中处理器被配置用于调用程序指令执行上述方法。存储介质中序指令当被处理器执行时处理器执行上述方法。
技术领域
本发明涉及业务数据存储领域,具体地说是一种将业务数据更新至Hive的方法、终端及存储介质。
背景技术
Hive是一种基于Hadoop的数据仓库,Hive提供了一种事务桶表,基于这种事务桶表可以实现数据的更新功能。Hive提供了SQL、Streaming API、以及Mutation API三种方式来处理数据。
(1)SQL方式,采用insert、update语句(如update Table_1 set modDay=’2019-08-19’where id=’1’;),该方式一次只能更新一条业务数据,当大量业务数据发生变更时,采用SQL方式更新至Hive的效率十分低下,不适合;
(2)Streaming API方式,该方式支持批量处理Hive数据,但仅支持批量写入数据,不支持更新数据;
(3)Mutation API方式,该方式支持批量写入、更新Hive数据。
Hive Mutation API提供了MutatorClient、Transaction和MutatorCoordinator等接口,Hive开发人员可以调用这些接口实现新增或更新Hive事务表数据。具体逻辑是:创建一个MutatorClient,将业务数据写入一个和业务表对应的JavaBean实例,声明一个Transaction,采用MutatorCoordinator.insert()或采用MutatorCoordinator.update()新增一条Hive事务表数据或更新一条Hive表数据,提交事务,关闭连接。
Hive Mutation API提供了写入、更新Hive事务表数据的方式,但是对于以下内容该方式没有形成完整的方案:Hive与业务表的对接、业务表数据的写入和更新以及大量业务表的处理。
基于上述分析,如何实现Hive与业务表的对接、业务表数据的写入和更新以及大量业务表的处理,是需要解决的技术问题。
发明内容
本发明的技术任务是针对以上不足,提供一种将业务数据更新至Hive的方法、终端及存储介质,来解决如何实现Hive与业务表的对接、业务表数据的写入和更新以及大量业务表的处理的问题。
第一方面,本发明提供一种将业务数据更新至Hive的方法,其特征在用于将业务数据写入或者更新至Hive中,所述方法包括如下步骤:
S100、动态创建Hive事务表的JavaBean Class实例;
S200、从业务数据中提取业务主键,从Hive事务表中查询数据并获取存储的业务主键和Hive虚拟主键,并构建反映业务主键和Hive虚拟主键映射关系的映射关系Map;
S300、基于映射关系Map判断业务数据表中业务数据为待更新的业务数据还是待新增的业务数据,并通过JavaBean实例将待更新的业务数据写入待更新的业务数据集、将待新增的业务数据写入待新增的业务数据集;
S400、将待更新的业务数据集存储至Hive事务表,将待新增的业务数据集添加Hive虚拟主键后存储至Hive事务表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件集团有限公司,未经浪潮软件集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910899330.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置