[发明专利]基于HIVE的拉链式模型数据汇聚方法及系统在审
申请号: | 202111289420.2 | 申请日: | 2021-11-02 |
公开(公告)号: | CN114238460A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 时敏 | 申请(专利权)人: | 北京思特奇信息技术股份有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/215;G06F16/23 |
代理公司: | 北京汇信合知识产权代理有限公司 11335 | 代理人: | 林聪源 |
地址: | 100086 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于HIVE的拉链式模型数据汇聚方法及系统,应用于数据汇聚技术领域,方法包括:对接业务系统,并抽取原始数据;对原始数据进行清洗和标准化,以确定标准接口模型;由目标结果模型中获取当前有效数据,与标准接口模型内关联,确定待更新数据模型;将标准接口模型左外关联待更新数据模型,剔除主键重复的数据以生成增量数据,并插入至目标结果模型中;将标准接口模型内关联待更新数据模型,将全字段匹配的数据删除,并对待更新数据模型进行更新。通过本发明的技术方案,避免了文件级操作,实现了数据拉链式存储,能够保留所有数据变化轨迹,同时能够降低数据冗余度,模板化的开发方式降低了开发工作量和运维难度。 | ||
搜索关键词: | 基于 hive 链式 模型 数据 汇聚 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京思特奇信息技术股份有限公司,未经北京思特奇信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111289420.2/,转载请声明来源钻瓜专利网。