[发明专利]唯一自然人标识计算的方法、装置、电子设备和存储介质在审
申请号: | 202210376670.8 | 申请日: | 2022-04-12 |
公开(公告)号: | CN114862449A | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 宋亚恒 | 申请(专利权)人: | 上海虎瑾信息技术有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/2457;G06F16/2458 |
代理公司: | 北京市盈科律师事务所 11344 | 代理人: | 陈晨 |
地址: | 200241 上海市闵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 唯一 自然人 标识 计算 方法 装置 电子设备 存储 介质 | ||
1.一种唯一自然人标识计算的方法,其特征在于,包括:
根据用户和设备的信息生成用户设备宽表,所述用户设备宽表中包括与用户和设备相关的字段和其对应的值:
进行第一次迭代计算,用户设备宽表中每一行选择第一个不为空的值,作为UniqueId,形成单独一列,每一行原先的内容作为Context;形成第一次迭代计算表;
进行第一次聚合,把第一次迭代计算表中具有相同UniqueId的行合并,去掉UniqueId的列,形成第一次聚合表;
循环迭代,把第一次聚合表的每一列字段依次作为UniqueId,重复进行上述迭代计算和聚合,形成最后的聚合表;
将最后的聚合表的每一行都标记唯一自然人标识。
2.根据权利要求1所述的唯一自然人标识计算的方法,其特征在于,所述用户设备宽表至少包括以下至少之一:UserId、DeviceId、phone、imei、idfa、openid、Tags。
3.根据权利要求1所述的唯一自然人标识计算的方法,其特征在于,还包括:循环迭代中将迭代计算表或聚合表的数据重新分布,平均分配给不同的机器。
4.根据权利要求1所述的唯一自然人标识计算的方法,其特征在于,还包括:迭代计算中将迭代计算表的数据序列化和反序列化的操作。
5.根据权利要求4所述的唯一自然人标识计算的方法,其特征在于,所述聚合表包括Context,判断Context每一列内容是否有重复,有重复则合并。
6.一种唯一自然人标识计算的装置,其特征在于,包括:
建表模块,被配置为根据用户和设备的信息生成用户设备宽表,所述用户设备宽表中包括与用户和设备相关的字段和其对应的值:
计算模块,被配置为:
进行第一次迭代计算,用户设备宽表中每一行选择第一个不为空的值,作为UniqueId,形成单独一列,每一行原先的内容作为Context;形成第一次迭代计算表;
进行第一次聚合,把第一次迭代计算表中具有相同UniqueId的行合并,去掉UniqueId的列,形成第一次聚合表;
循环迭代,把第一次聚合表的每一列字段依次作为UniqueId,重复进行上述迭代计算和聚合,形成最后的聚合表;
将最后的聚合表的每一行都标记唯一自然人标识。
7.根据权利要求6所述的唯一自然人标识计算的装置,其特征在于,所述用户设备宽表至少包括以下至少之一:UserId、DeviceId、phone、imei、idfa、openid、Tags。
8.根据权利要求6所述的唯一自然人标识计算的装置,其特征在于,计算模块还被配置为在循环迭代中将迭代计算表或聚合表的数据重新分布,平均分配给不同的机器。
9.根据权利要求6所述的唯一自然人标识计算的装置,其特征在于,计算模块还被配置为在迭代计算中将迭代计算表的数据序列化和反序列化的操作。
10.根据权利要求6所述的唯一自然人标识计算的装置,其特征在于,所述聚合表包括Context,判断Context每一列内容是否有重复,有重复则合并。
11.一种电子设备,其特征在于,包括:处理器、存储器以及存储在存储器上运行的计算机程序,所述处理器执行计算机程序时实现权利要求1-5中任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机程序被处理器执行时实现权利要求1-5中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海虎瑾信息技术有限公司,未经上海虎瑾信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210376670.8/1.html,转载请声明来源钻瓜专利网。