[发明专利]一种基于MPP架构数据库的数据去重方法及装置在审
| 申请号: | 202210168375.3 | 申请日: | 2022-02-23 | 
| 公开(公告)号: | CN114547012A | 公开(公告)日: | 2022-05-27 | 
| 发明(设计)人: | 李恒昌;甘剑锋 | 申请(专利权)人: | 度小满科技(北京)有限公司 | 
| 主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/21 | 
| 代理公司: | 北京知帆远景知识产权代理有限公司 11890 | 代理人: | 刘岩磊 | 
| 地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | 本发明公开了一种基于MPP架构数据库的数据去重方法,该方法在根据统计参数确定原始数据中待去重的目标数据后,将多指标去重操作转化为多个单一指标去重操作,对目标数据的各去重指标进行逐一去重处理,再按照去重维度聚合各去重子项,本方法中的单一指标逐一去重相比传统的多指标同时去重工作量显著缩减,能有效的解决直接count distinct时计算效率低下、甚至无法运行的问题,同时资源占用也较小,且随着去重指标个数的增加,该方法对于效率的提升效果更为显著,可以实现多指标的快速去重。本发明还公开了一种基于MPP架构数据库的数据去重装置、设备及可读存储介质,具有相应的技术效果。 | ||
| 搜索关键词: | 一种 基于 mpp 架构 数据库 数据 方法 装置 | ||
【主权项】:
                暂无信息
            
                    下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
                
                
            该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于度小满科技(北京)有限公司,未经度小满科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210168375.3/,转载请声明来源钻瓜专利网。





