[发明专利]数据划分处理方法、装置、电子设备及存储介质在审

专利信息
申请号: 202111092757.4 申请日: 2021-09-17
公开(公告)号: CN113806451A 公开(公告)日: 2021-12-17
发明(设计)人: 邢雨濛 申请(专利权)人: 平安普惠企业管理有限公司
主分类号: G06F16/28 分类号: G06F16/28;G06F16/25;G06F16/22
代理公司: 北京鸿元知识产权代理有限公司 11327 代理人: 袁文婷;张娓娓
地址: 518000 广东省深圳市前海深港合作区前*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 划分 处理 方法 装置 电子设备 存储 介质
【说明书】:

发明涉及人工智能技术,提供一种数据划分处理方法,首先按照预设维度在hive中剥离待处理数据,再通过hive的临时目录将预转成的特定格式文件置于预设的文件服务器中,而后通过预设的前置业务系统从文件服务器中获取特定格式文件,并将特定格式文件保存至预设的业务服务器中以形成业务文件数据;其中,该预设的前置业务系统与文件服务器预连接,再在业务服务器中对业务文件数据进行进行拆分处理以形成文件组,并对文件组进行另存储以完成数据划分处理,在本实施例中,通过前置业务系统与文件服务器去处理小批量的数据可以为hive减轻压力,从而让hive能够更专注的处理真正意义上的“大数据,大大提高数据处理效率,进而节省人力和时间。

技术领域

本发明涉及人工智能领域,涉及数据处理技术,尤其涉及一种数据划分处理方法、装置、电子设备及计算机可读存储介质。

背景技术

在保险业务系统中目前大数据的架构是将目前现有存在oracle的数据,通过数据同步的方式将所有的业务数据同步至hive数据库(hive是目前大数据存储与数据分析的类sql数据仓库工具)。开发人员需要将数据以业务为维度进行表区分,每个业务的数据应该属于该业务表的范围下,整合从保险业务系统建立起来的所有数据。

目前所有报表或者展示数据平台都需要通过在hive中开发进行数据分析,再将数据同步至业务系统中,一般情况下均在hive库中做好数据计算、分析等操作,将得到的结果通过查询的方式同步给业务系统,而hive提供的方案是通过类sql查询对应想要的数据,编写脚本通常以月、100W数据为维度(例:当月有500W数据,需要以100W为维度生成5个文件),但在以100W为维度划分文件时,每次100W的数据都要重新进行全量的MapReduce(统计分析数据函数),导致速率较低,时常较长,严重影响效率。

因此,亟需一种能够提高数据处理速率,减少处理时长,且节省人力的数据划分处理方法。

发明内容

本发明提供一种数据划分处理方法,以解决目前所有报表或者展示数据平台都需要通过在hive中开发进行数据分析,再将数据同步至业务系统中,一般情况下均在hive库中做好数据计算、分析等操作,将得到的结果通过查询的方式同步给业务系统,而hive提供的方案是通过类sql查询对应想要的数据,编写脚本通常以月、100W数据为维度,但在以100W为维度划分文件时,每次100W的数据都要重新进行全量的MapReduce,导致速率较低,时常较长,严重影响效率的问题。

为实现上述目的,本发明提供的一种数据划分处理方法,包括:

按照预设维度在hive中剥离待处理数据,并对所述待处理数据进行格式转换以形成特定格式文件;

通过所述hive的临时目录将所述特定格式文件置于预设的文件服务器中;

通过预设的前置业务系统从所述文件服务器中获取所述特定格式文件,并将所述特定格式文件保存至预设的业务服务器中以形成业务文件数据;其中,所述预设的前置业务系统与所述文件服务器预连接;

在所述业务服务器中对所述业务文件数据进行进行拆分处理以形成文件组,并对所述文件组进行另存储以完成数据划分处理。

可选地,所述按照预设维度在hive中剥离待处理数据,并对所述待处理数据进行格式转换以形成特定格式文件,包括:

按照预设维度在所述hive中捞取待处理数据,并对所述待处理数据进行标记;

根据所述标记,通过预设的导出语句将所述待处理数据从所述hive中剥离导出;

对从所述hive中剥离导出的所述待处理数据进行特定格式的格式设置;

基于所述特定格式对所述待处理数据进行格式转换以形成特定格式文件。

可选地,所述通过所述hive的临时目录将所述特定格式文件置于预设的文件服务器中,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安普惠企业管理有限公司,未经平安普惠企业管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111092757.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top