[发明专利]一种OLAP多维分析和数据挖掘系统在审
申请号: | 201710966150.1 | 申请日: | 2017-10-17 |
公开(公告)号: | CN107704608A | 公开(公告)日: | 2018-02-16 |
发明(设计)人: | 窦志成;谢峰;肖超峰;曾泽群 | 申请(专利权)人: | 北京一览群智数据科技有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京中创阳光知识产权代理有限责任公司11003 | 代理人: | 尹振启 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 olap 多维 分析 数据 挖掘 系统 | ||
1.一种OLAP多维分析和数据挖掘系统,其特征在于,具有数据模型、分布式OLAP引擎、OLAP解析引擎、多维分析报表接口、数据挖掘接口和数据可视化工具,所述数据模型由可视化界面供用户通过拖拽完成数据建模,具有统一的模型配置,系统自动进行模型适配,使数据模型配合内部其他引擎或工具调用;所述分布式OLAP引擎为OLAP系统提供多维数据模型预处理能力;所述OLAP解析引擎支持大数据平台和关系型数据库的多维度查询解析引擎,将MDX语句解析为标准的SQL语言;所述多维分析报表接口和数据挖掘接口具有多维度的数据分析和数据挖掘功能,提供报表分析方法和数据挖掘算法模型;所述数据可视化工具为多维分析报表接口和数据挖掘接口中的报表分析和数据挖掘提供可视化操作,并提供可视化结果社交分享和图表管理功能。
2.如权利要求1所述的方法,其特征在于,所述数据模型构建的过程的前后顺序为:建立数据表、配置数据源、加载数据表、选择事实表和维表、选择维度和指标最终建立模型;所述数据源包括关系型数据库以及大数据平台的Hive数据仓库。
3.如权利要求2所述的方法,其特征在于,针对不同数据源所适配的配置文件不同,为使其格式化和规范化,在前端页面进行配置时该方法能让用户进行统一的配置,而不需针对不同的数据源进行配置,配置的步骤包括:步骤1,数据源配置文件的格式抽取;步骤2,配置文件的格式化处理;步骤3,配置文件的生成。
4.如权利要求1所述的方法,其特征在于,所述分布式OLAP引擎在大数据平台上构建数据立方体对大规模数据处理,并基于数据立方体,提供实时的查询统计,对存储在大数据平台中的大规模数据进行预处理,将数据进行提取、筛选和汇总,构建数据立方体并存储,供上层模块直接对结果数据进行查询。
5.如权利要求1所述的方法,其特征在于,所述多维分析报表接口可以通过拖拽来快速生成报表,报表生成后,通过调用接口中的方法,可对报表数据进行钻取、上卷、切片、切块、旋转、过滤、排序、基本数理统计和数据导出操作,让数据更精准更有意义地呈现给用户。所述对报表数据的钻取为在维的不同层次间,对报表中汇总数据的拆分,得到更细节的报表数据,所述对报表数据的上卷为钻取的逆向操作,对报表中细节的数据和分散的数据进行汇总,所述对报表数据的切片提供选择报表数据中特定的值进行分析,所述对报表数据的切块提供选择报表中特定区间的数据进行分析,所述对报表数据的旋转对报表数据行列互换,重新生成报表数据,所述对报表数据的过滤对报表数据过滤,进行特定条件的数据过滤,包括对调节为:大于、小于、等于、前十、后十和文本数据的勾选,所述对报表数据的排序对报表数据中数据进行升序或者降序排序,所述对报表数据的数理统计提供对报表数据进行均值、最大值、最小值、中值、方差和标准差的处理,所述对报表数据的数据导出对报表数据导出成csv、txt和excel等格式,供下载和保存。
6.如权利要求5所述的方法,所述拖拽的过程包括对象的定位、对象的抓取、对象的移动和对象实体的识别,拖拽的具体步骤为为:步骤1,通过鼠标单击处位置的计算,判断其位置是否具有对象,如果有对象,判断该对象是否具有拖动的属性;步骤2,当对象具有可拖动的属性,通过鼠标的点击和保持,保持该对象的持久性,并记录该点的起始位置数据;步骤3,抓取后的对象通过鼠标的移动,动态的计算该对象的位置坐标,当释放鼠标,判断该对象最后的位置是否具有放置该对象的容器和属性,如果具有放置的条件,则计算该对象的长、宽、高基本尺寸信息,结合现有的放置点所放置的对象信息,得到放置该对象的位置,通过类似于队列的排列方式,放置该对象,完成对该对象的移动,如果最后的位置不具备放置该对象的容器和属性,则返回起始位置点;步骤4,拖拽后的对象需进行识别,识别该对象中包含的实体,实体类型包括:行的名字、列的名字、指标的名字和数据库表的名字等,在该识别的过程中,每个对象都具有唯一的类型标识,该标识在所有的动作中保持一致,使得前端和后端的能够准确的识别。
7.如权利要求1所述的方法,其特征在于,所述数据挖掘接口提供了分类、聚类、回归和预测模型的接口,每个预测模型接口下包含多种数据挖掘方式的实现,所述数据挖掘接口能够根据数据的类型,调用最适合的数据挖掘模型接口,并可以通过配置参数调试数据挖掘的结果,所述模型包括Kmean聚类和多项式回归。
8.如权利要求1所述的方法,其特征在于,所述可视化工具提供基本的图表展示功能,2.5D数据可视化模型和3D数据可视化模型,对报表数据的分析,系统能够根据数据的类型适配可视化模型呈现数据形态,数据可视化后的图表结果保存在用户的管理界面中,同时后台保存相应的参数配置,对图表局部放大,增加数据间的间隔,通过多种方式把当前报表分析图表和数据挖掘可视化结果保存在网络上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京一览群智数据科技有限责任公司,未经北京一览群智数据科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710966150.1/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置