[发明专利]一种数据分析引擎系统、实现方法、设备及存储介质在审
申请号: | 202111674593.6 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114493169A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 赵寅;石元春;张永强 | 申请(专利权)人: | 武汉达梦数据库股份有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q30/02;G06F3/0486;G06F9/451;G06F16/25 |
代理公司: | 武汉智嘉联合知识产权代理事务所(普通合伙) 42231 | 代理人: | 张璐 |
地址: | 430000 湖北省武汉市东湖新技术开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 分析 引擎 系统 实现 方法 设备 存储 介质 | ||
本申请涉及一种数据分析引擎系统、实现方法、设备及存储介质,该系统包括:需求确定模块,用于确定当前业务所需的目标节点,目标节点至少包括目标数据处理节点和目标数据分析节点;业务流程生成模块,用于根据当前业务所需的目标数据处理节点和目标数据分析节点,从预设的组件库获取对应的目标组件,生成当前业务的流式业务处理流程;分析模块,用于获取当前业务数据,并接入至流式业务处理流程进行数据处理和实时分析,得到目标分析结果。本申请能够将数据的处理和分析达到同步,而且实现实时计算、实时分析的效果,解决了传统分析上存在的数据差异性或实时性缺点。
技术领域
本申请涉及数据处理分析技术领域,尤其是涉及一种数据分析引擎系统、实现方法、设备及存储介质。
背景技术
在数据处理分析领域,传统商业智能系统通常分为两步:第一步数据处理:由技术人员根据需求进行复杂的数据建模,然后通过etl工具生成中间表;第二步数据分析:由业务人员通过拖拉拽的方式进行数据分析,BI工具将分析定义转换成sql语言;然后通过sql引擎(传统的关系型数据库,或者类sql的分析引擎,例如hive、Impala等)进行分析计算;但是带来两个问题:1、架构复杂,数据处理和数据分析计算至少依赖两套引擎;2、业务人员不能做到对原始数据的一站式即席分析。
此外,传统的数据分析引擎将数据通过etl工具将业务系统数据抽取到中间表,可能抽取到中间表的数据为统计数据和经过一些etl内部处理后的数据,然后第二步通过数据分析引擎在这些中间表里面建立自己业务分析,这种常规的数据分析往往存在很大的数据差异性,因为中间表的数据都是通过etl工具抽取过来的,并不是即实数据,达不到预想的需求。
发明内容
有鉴于此,本申请提供一种数据分析引擎系统、实现方法、设备及存储介质,用以解决现有数据处理分析引擎存在数据差异性或实时性缺陷的技术问题。
为了解决上述问题,第一方面,本申请提供一种数据分析引擎系统,所述系统包括:
需求确定模块,用于确定当前业务所需的目标节点,所述目标节点至少包括目标数据处理节点和目标数据分析节点;
业务流程生成模块,用于根据所述当前业务所需的目标数据处理节点和目标数据分析节点,从预设的组件库获取对应的目标组件,生成当前业务的流式业务处理流程;
分析模块,用于获取当前业务数据,并接入至所述流式业务处理流程进行数据处理和实时分析,得到目标分析结果。
可选的,所述目标节点还包括目标读取节点和/或目标预处理节点。
可选的,所述业务流程生成模块,包括:
拖拽单元,用于从所述组件库中自定义拖拽目标组件,生成目标节点,以得到当前业务的流式业务处理流程。
可选的,所述系统还包括:
组件模块,用于提供多种流式计算组件,形成组件库。
可选的,所述组件模块,包括:
算法单元,用于提供多种机器学习算法组件,以供自定义生成目标数据处理节点;
分析单元,用于提供多种数据分析组件,以供自定义生成目标数据分析节点。
可选的,所述组件模块,还包括:
数据读取单元,用于提供读取组件,以供自定义生成目标读取节点,
预处理单元,用于提供多种预处理算法组件,以供自定义生成目标预处理节点。
第二方面,本申请提供一种基于所述的数据分析引擎系统的实现方法,包括:
确定当前业务所需的目标节点,所述目标节点至少包括目标数据处理节点和目标数据分析节点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉达梦数据库股份有限公司,未经武汉达梦数据库股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111674593.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置