[发明专利]一种数据模型抽取方法及系统、终端、介质在审

专利信息
申请号: 202310361512.X 申请日: 2023-04-07
公开(公告)号: CN116089518A 公开(公告)日: 2023-05-09
发明(设计)人: 吴华夫;黄浩;黄潮勇;张亿仙;刘芳 申请(专利权)人: 广州思迈特软件有限公司
主分类号: G06F16/25 分类号: G06F16/25;G06F16/215;G06F16/23;G06F16/2455;G06F16/28
代理公司: 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 代理人: 徐红银;张琳
地址: 510663 广东省广州市天*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据模型 抽取 方法 系统 终端 介质
【说明书】:

发明提供一种数据模型抽取方法和系统、终端和介质,包括:将ETL任务和数据模型抽取任务串行执行;数据模型抽取任务完成后,更新高速缓存库中的数据模型;查询当前数据模型的数据时,直接从高速缓存库中获取。本发明将业务库数据抽取到指定数据库以及数据模型抽取任务串行执行,有效保证数据的准确性和一致性;在产品的作业流里面,可以很清晰地看到是ETL抽取过程失败,还是数据模型抽取过程失败。相比之前两个定时任务错开执行的方式,比较清晰,提高故障排查效率,简化运维成本;本发明数据模型抽取到高速缓存库后,再次查询当前数据集或分析的数据时,能够直接从高速缓存库获取数据,保证秒级获取大级别量的数据结果,提高系统性能。

技术领域

本发明涉及大数据领域,具体地,涉及一种数据模型抽取方法及系统、终端、介质。

背景技术

ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。

在现有技术中,复杂的数据处理都要借助上述ETL完成,同时为了提升查询性能,会把数据模型的数据抽取到缓存库,但必须是ETL任务完成之后,才执行数据模型的抽取。

技术人员在指标模型中建好维表或事实表,需要绑定ETL进行灌数;而生成的指标模式默认是直连,由于是模型表,数据量太多直连性能出现问题,所以改成“抽取模式”,而现有技术中数据模型抽取模式下会自动生成计划任务,作业流调度ETL也会设一个计划任务把业务库数据抽取到指定数据库,数据模型的抽取和ETL的调度是分开执行的,会有一个先后顺序或时间差,如果ETL中具体任务执行不成功即没有把最新数据更新到表中,会导致数据模型在定好的时间抽取就没有意义或者说数据不准确。

经检索,申请号为CN104732310A的中国发明公开了一种基于统一数据模型的数据集成方法,该方法通过统一数据模型和数据抽取机制建立起各外部数据源所存储的实体数据对象与虚拟数据对象之间的一一对应关系,通过数据关联关系建立起不同虚拟数据对象之间的联系,并通过统一虚拟数据中心实现所有虚拟数据对象的统一管理;由于实体数据对象与虚拟数据对象之间的一一对应关系,从而实现对实体数据对象的统一管理。其只涉及固有数据读取,无法在虚拟数据中心对“脏数据”进行管理,并且不能适应数字经济时代背景下大级别数据量读写性能的需求。

发明内容

针对现有技术中的缺陷,本发明的目的是提供一种数据模型抽取方法及系统、终端、介质,能够有效保证数据的准确性和一致性。

根据本发明的一个方面,提供一种数据模型抽取方法,包括一种数据模型抽取方法,包括:

将ETL任务和数据模型抽取任务串行执行;

所述数据模型抽取任务完成后,更新高速缓存库中的数据模型;

查询当前数据模型的数据时,直接从所述高速缓存库中获取。

优选地,所述将ETL任务和数据模型抽取任务串行执行,包括:

建立若干ETL任务;

建立作业流;

将所述作业流与所述ETL任务串联;

将所述数据模型抽取任务与所述ETL任务串联;

设置所述作业流的定时任务;

执行所述作业流的定时任务,若执行成功,执行所述ETL任务,即ETL灌输到指定数据库表,并进行所述数据模型抽取任务;若执行失败,根据重试机制,再次执行所述作业流。

优选地,所述作业流由多个任务组成,包括ETL和数据模型抽取任务。

优选地,所述重试机制为通过监听作业流定时执行的状态,判断是否在给定的时间后自动重新运行当前运行失败的作业流。

优选地,若是所述作业流的定时任务执行失败,能够直接判断是所述ETL任务还是所述数据模型抽取任务的执行失败。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州思迈特软件有限公司,未经广州思迈特软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310361512.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top