[发明专利]一种基于包管理的分布式数据作业调度的方法和系统有效
申请号: | 201910368543.1 | 申请日: | 2019-05-05 |
公开(公告)号: | CN110069334B | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 吕云恒 | 申请(专利权)人: | 重庆天蓬网络有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48 |
代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 梁爱荣 |
地址: | 401135 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 管理 分布式 数据 作业 调度 方法 系统 | ||
1.一种基于包管理的分布式数据作业调度的方法,其特征在于,包括:
步骤S1、系统创建本地工作流任务,在创建的所述本地工作流任务中,通过拖拽操作来创建DAG流程图;
步骤S2、根据创建的所述DAG流程图设置调度规则,并提交设置的所述调度规则以进行任务审核;
步骤S3、所述系统后台的守护程序不断轮询监听线上周期任务,并定时生成次日全量工作流任务实例,以及所述工作流任务实例所依赖的关系数据,向执行引擎发送所述工作流任务实例的执行请求;
步骤S4、所述执行引擎接收所述工作流任务实例的执行请求,并排队异步处理,通过解析工作流各子节点任务类型、参数变量数据,并触发相应作业插件,执行任务节点代码逻辑;
系统通过接口获取所述异步处理执行工作流详细日志;所述系统后台的守护程序通过接口查询所述工作流任务实例的执行状态去刷新本地的所述工作流任务实例以及所述依赖的关系数据的执行状态;
所述步骤S2中,进行任务审核具体包括:
系统对所提交的所述调度规则进行审核,若审核通过,则通过系统后台创建远端工作流任务,并执行步骤S3,若审核不通过,则结束,并返回步骤S1;
所述步骤S3中,还包括:记录所述工作流任务实例的执行状态数据,同时所述系统后台的守护程序触发执行满足所述调度规则的所述工作流任务实例;
所述记录所述工作流任务实例的执行状态数据,具体包括:
记录脚本内容、所述流程子节点的依赖的关系数据,形成线下工作流快照数据;
所述通过系统后台创建远端工作流任务,具体包括:
若审核通过,则通过系统后台调用azkaban接口,以创建所述远端工作流任务,所述远端工作流任务包括刷新访问Token、上传zip包或创建工作流中的一种,所述远端工作流任务支持版本机制以方便进行历史任务运维;所述线下工作流快照数据和线上版本工作流数据均已存在,所述本地工作流任务和所述远端工作流任务通过任务KEY+版本号作为唯一编码串联起来,等待系统后台进行相关处理。
2.根据权利要求1所述的基于包管理的分布式数据作业调度的方法,其特征在于,所述步骤S1中用户创建本地工作流任务,所述DAG流程图中的流程子节点包括shell节点、HiveSQL节点、数据导出节点、MySQL节点、KEY节点中的一个或多个。
3.根据权利要求2所述的基于包管理的分布式数据作业调度的方法,其特征在于,所述KEY节点代表外部任务,所述外部任务包括本项目内的任务或者跨项目的任务,在本项目内的任务或者跨项目的任务中注入所述依赖的关系数据。
4.根据权利要求3所述的基于包管理的分布式数据作业调度的方法,其特征在于,设置的所述调度规则包括自动重跑、生效日期、起调时间、执行周期、间隔时间、任务自依赖中的一种或多种。
5.根据权利要求4所述的基于包管理的分布式数据作业调度的方法,其特征在于,所述执行周期包括小时、天、周、月,所述间隔时间包括间隔一小时、间隔两小时或间隔N小时,N为正整数。
6.根据权利要求1所述的基于包管理的分布式数据作业调度的方法,其特征在于,所述系统后台的守护程序不断轮询监听线上周期任务,并定时生成次日全量工作流任务实例,具体包括:
所述系统后台的守护程序不断轮询监听线上周期任务,每天23点生成次日的全量工作流任务实例以及所述工作流任务实例所依赖的关系数据,并记录所述工作流任务实例的执行状态数据;
所述系统后台的守护程序同时触发执行满足所述调度规则的所述工作流任务实例,向所述执行引擎发送所述工作流任务实例的执行请求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆天蓬网络有限公司,未经重庆天蓬网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910368543.1/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置