[发明专利]数据ETL处理方法、装置、设备及存储介质在审
申请号: | 201810529602.4 | 申请日: | 2018-05-29 |
公开(公告)号: | CN110609860A | 公开(公告)日: | 2019-12-24 |
发明(设计)人: | 唐堂 | 申请(专利权)人: | 中国移动通信集团重庆有限公司;中国移动通信集团有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/28 |
代理公司: | 11258 北京东方亿思知识产权代理有限责任公司 | 代理人: | 尹红敏 |
地址: | 401121*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种数据ETL处理方法、装置、设备及存储介质。该方法包括:获取源数据仓库的数据库日志发生变化的变化日志;识别并标记变化日志中的每条日志的类型;根据类型,抽取源数据仓库发生变化的数据;对数据进行数据清洗和数据转换;将经过数据清洗和数据转换的数据中、且所标记的日志的类型为插入类型和修改类型对应的数据加载至目标数据仓库中;将源数据仓库未发生变化的数据加载至目标数据仓库中。本发明实施例的数据ETL处理方法、装置、设备及存储介质,仅抽取源数据仓库中发生变化的数据,未对源数据仓库中未发生变化的数据进行抽取,实现了数据的增量抽取,进而能够提高数据ETL的效率。 | ||
搜索关键词: | 仓库 源数据 抽取 变化日志 存储介质 目标数据 数据加载 数据清洗 数据转换 日志 数据库日志 数据仓库 增量抽取 获取源 | ||
【主权项】:
1.一种数据抽取-转换-加载ETL处理方法,其特征在于,所述方法包括:/n获取源数据仓库的数据库日志发生变化的变化日志;/n识别并标记所述变化日志中的每条日志的类型;/n根据所述类型,抽取所述源数据仓库发生变化的数据;/n对所述数据进行数据清洗和数据转换;/n将经过数据清洗和数据转换的数据中、且所标记的日志的类型为插入类型和修改类型对应的数据加载至目标数据仓库中;/n将所述源数据仓库未发生变化的数据加载至所述目标数据仓库中。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团重庆有限公司;中国移动通信集团有限公司,未经中国移动通信集团重庆有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810529602.4/,转载请声明来源钻瓜专利网。