[发明专利]一种多维关联数据的强关联数据生成方法有效
申请号: | 201710389456.5 | 申请日: | 2017-05-27 |
公开(公告)号: | CN107248929B | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 蔡自彬 | 申请(专利权)人: | 北京知道未来信息技术有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;H04L29/06 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 司立彬 |
地址: | 100102 北京市朝阳区阜*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多维 关联 数据 生成 方法 | ||
本发明公开了一种多维关联数据的强关联数据生成方法。本方法为:1)将提取的多维关联数据存入图系统;2)对每一记录生成一对节点以及连接该对节点的边;3)确定强关联的目标数据,对于每一节点,如果该节点的类型为目标数据的类型,则将该节点的标签设置为该节点对应的数据;否则将该节点的标签设置为unknown;4)利用图的标签传播算法进行消息发送;5)各节点选择收到消息中权重最大的标签作为本节点的标签,如果节点本身是目标数据,则该节点的标签不做修改;6)过滤掉标签为unknown的节点以及过滤掉数据与标签值相同的节点,剩余节点对应的数据即为目标数据的强关联数据。本发明可有效的针对多维关联数据计算强关联数据。
技术领域
本发明涉及一种多维关联数据的强关联数据生成方法,属于网络技术领域。
背景技术
通过用户授权后,网站会记录用户的手机号、IMEI等信息。实际使用过程中,一个用户可能会换手机登陆网站,网站获取的手机号不变,但IMEI或IDFA会发生变化;同样用户可能在相同的手机设备上使用不同手机号登陆,即手机号不同,IMEI号不变。另外网站可能会遭受撞库攻击,即大量出现同一个IMEI号,手机号却不同的情况。
在某些场景下,例如用户画像,需要将IMEI和手机号关联起来,并找到IMEI强关联的手机号,即该IMEI最有可能与哪个手机号绑定。
现有技术方案一般处理方法为统计IMEI关联的所有手机号,选择关联次数最多、关联时间最近的手机号作为强关联手机号。
然而现有技术方案无法解决多维关联问题,例如一个手机号与Email关联,并且关联次数很多、关联时间较新,该Email又与IMEI关联并且关联次数很多、关联时间较新;然后该手机号和IMEI直接关联次数较少。实际中该手机号和IMEI是强关联的,但是现有技术方案未得出这样的结果。
发明内容
针对现有技术中存在的技术问题,本发明的目的在于提供一种多维关联数据的强关联数据生成方法。
本发明的技术方案为:
一种多维关联数据的强关联数据生成方法,其步骤为:
1)将提取的多维关联数据存入图系统;所述多维关联数据的每一记录包括相互关联的数据、关联次数、最近关联时间;
2)对每一记录生成一对节点以及连接该对节点的边;
3)确定强关联的目标数据,对于每一节点,如果该节点的类型为目标数据的类型,则将该节点的标签设置为该节点对应的数据;否则将该节点的标签设置为unknown;
4)利用图的标签传播算法进行消息发送,其中,对于步骤2)生成的每一对节点,如果节点1的标签不是unknown并且节点2的类型不是目标数据的类型,则向节点2发送消息,该消息内容包括:节点1的标签值和边的权重;如果节点2的标签不是unknown并且节点1的类型不是目标数据的类型,则向节点1发送消息,该消息内容包括节点2的标签值和边的权重;其中节点1、节点2是同一边连接的两节点;
5)各节点选择收到消息中权重最大的标签作为本节点的标签,如果节点本身是目标数据,则该节点的标签不做修改;
6)过滤掉标签为unknown的节点以及过滤掉数据与标签值相同的节点,剩余节点对应的数据即为目标数据的强关联数据。
进一步的,所述记录的数据格式为:ID1类型编号、ID1值、ID2类型编号、ID2值、关联次数、最近关联时间;其中,ID1类型编号、ID1值分别为记录中一数据的类型编号及其类型值,ID2类型编号、ID2值分别为该记录中另一数据的类型编号及其类型值。
进一步的,所述节点的属性包括类型编号及其类型值、标签。
进一步的,所述边的属性包括权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京知道未来信息技术有限公司,未经北京知道未来信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710389456.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型抗菌三元乙丙橡胶的加工工艺
- 下一篇:回转泵工作轮
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置