[发明专利]基于数据仓库构建主题模型的方法、装置以及存储介质在审
| 申请号: | 202010555963.3 | 申请日: | 2020-06-17 |
| 公开(公告)号: | CN113806391A | 公开(公告)日: | 2021-12-17 |
| 发明(设计)人: | 宁任声 | 申请(专利权)人: | 北京滴普科技有限公司 |
| 主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/22;G06F16/25;G06Q10/06 |
| 代理公司: | 北京万思博知识产权代理有限公司 11694 | 代理人: | 刘冀 |
| 地址: | 100080 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 数据仓库 构建 主题 模型 方法 装置 以及 存储 介质 | ||
1.一种基于数据仓库构建主题模型的方法,其特征在于,包括:
接收用于创建主题模型的主题模型参数信息,其中所述主题模型用于通过面向主题的方式对数据仓库中与预定业务相关的数据进行分析;
根据所述主题模型参数信息,确定用于创建所述主题模型的指标模型,其中所述指标模型为用于对所述预定业务进行分析的指标所对应的逻辑模型;
根据所述指标模型创建所述主题模型;
创建与所述主题模型绑定的物理模型以及在物理数据库中创建与所述物理模型绑定的数据表结构,其中所述数据表结构用于构建所述数据仓库;以及
执行与所述数据表结构相关的ETL任务,生成与所述主题模型相关的数据。
2.根据权利要求1所述的的方法,其特征在于,还包括:
根据所述主题模型参数信息,确定与所述主题模型相关联的汇总粒度,其中所述汇总粒度用于对根据所述主题模型所确定的数据进行汇总;以及
根据所述主题模型参数信息,确定与所述主题模型相关联的数据范围,其中所述数据范围用于对根据所述主题模型所确定的数据进行筛选,并且其中
根据所述指标模型创建所述主题模型的操作,包括:根据所述指标模型、所述汇总粒度以及所述数据范围,创建所述主题模型。
3.根据权利要求2所述的方法,其特征在于,在所述指标模型为单个指标模型的情况下,确定与所述主题模型相关联的汇总粒度的操作,包括:
确定所述指标模型的维度,其中所述指标模型的维度用于确定所述指标模型的统计粒度;以及
根据所述主题模型参数信息,从所述指标模型的维度中选取至少一部分维度确定所述汇总粒度。
4.根据权利要求2所述的方法,其特征在于,在所述指标模型为多个指标模型的情况下,确定与所述主题模型相关联的汇总粒度的操作,包括:
确定所述多个指标模型的维度,其中多个指标模型的维度用于确定所述多个指标模型的统计粒度;
根据所述多个指标模型的维度,确定所述多个指标模型的公共维度,其中所述公共维度为所述多个指标模型所公有的维度;以及
根据所述主题模型参数信息,从所述公共维度中选取至少一部分维度确定所述汇总粒度。
5.根据权利要求2所述的方法,其特征在于,确定与所述主题模型相关联的数据范围的操作,包括:
接收用于确定所述数据范围的SQL条件;以及
根据SQL条件,对所述指标模型相关联的数据进行筛选,确定与所述主题模型相关联的数据范围。
6.根据权利要求2所述的方法,其特征在于,创建与所述主题模型绑定的物理模型以及与所述物理模型绑定的数据表结构的操作,包括:
根据所述指标模型创建所述物理模型,其中所述物理模型的字段包括所述指标模型的度量和/或维度;以及
根据所述物理模型的字段在所述物理数据库中创建所述数据表结构。
7.根据权利要求2所述的方法,其特征在于,执行与所述数据表结构相关的ETL任务,生成与所述主题模型相关的数据的操作,包括:
根据所述指标模型、所述汇总粒度以及所述数据范围生成所述ETL任务;以及
调度运行所述ETL任务,生成与所述主题模型相关的数据。
8.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行权利要求1至7中任意一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京滴普科技有限公司,未经北京滴普科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010555963.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种同心圆式混凝沉淀一体化装置
- 下一篇:一种金属感应的刮板运行故障监控系统





