[发明专利]多账号关联方法、装置及电子设备有效
申请号: | 201510673339.2 | 申请日: | 2015-10-16 |
公开(公告)号: | CN105354249B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 汤奇峰;陈冰强 | 申请(专利权)人: | 晶赞广告(上海)有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 吴敏 |
地址: | 200072 上海市闸北区灵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 账号 关联 方法 装置 电子设备 | ||
一种多账号关联方法、装置及电子设备,多账号关联方法包括:获取用户网络行为的统一资源定位符URL信息;按照网络入口规则从所述URL信息中规则挖掘账号信息;过滤所述账号信息,剔除脏数据;对过滤后的所述账号信息基于所述URL信息和Refferer消息在设定的时间间隔生成Session;提取同一所述Session下的所述账号信息,生成具备关联关系的账号信息组;根据所述关联关系计算所述每个账号信息组的支持度和置信度;基于所述支持度和所述置信度对所述账号信息组进行图运算,生成所述关联关系的图像。所述多账号关联方法充分的挖掘了用户的互联网访问行为信息,提高了用户账号信息分类的准确性、完整性。
技术领域
本发明涉及数据挖掘领域,尤其涉及一种多账号关联方法、装置及电子设备。
背景技术
随着大数据领域的不断扩张,互联网用户数据日益剧增。互联网用户的数据包括用户的年龄、性别、职业等用户信息,这些信息渗透在社交网络、电子商务等各大互联网领域,具备极大的经济价值,对定向精准地发布信息和资讯、预测用户行为、构建用户画像等,起着决定性的作用。
获取用户数据的前置条件,就是用户的挖掘与识别,现有技术通常基于同一个IP(Internet Protocol)或者IP和用户代理(User Agent)等粗粒度的关联规则,对网站储存在用户本地终端上的Cookie数据的身份信息(Identity,ID)和应用程序账号信息进行强制关联。
但是,由于网络互联的复杂多样性,同一用户往往具有多个网站的账号或者应用程序(Application,App)账号;且所述Cookie数据的ID信息和应用程序账号信息存在大量的脏数据;而且同一个IP或者IP和User Agent可能会被不同的上网用户所使用,造成关联规则不准确,进而无法精确的将同一用户的所有账号信息数据进行关联分类。
发明内容
本发明解决的技术问题是如何提高用户账号信息分类的准确性。
为解决上述技术问题,本发明实施例提供一种多账号关联方法,包括:
获取用户网络行为的统一资源定位符URL信息;
按照网络入口规则从所述URL信息中规则挖掘账号信息;
过滤所述账号信息,剔除脏数据;
对过滤后的所述账号信息基于所述URL信息和Refferer消息在设定的时间间隔生成Session;
提取同一所述Session下的所述账号信息,生成具备关联关系的账号信息组;
根据所述关联关系计算所述每个账号信息组的支持度和置信度;
基于所述支持度和所述置信度对所述账号信息组进行图运算,生成所述关联关系的图像。
可选的,所述账号信息包括应用程序账号和cookie ID信息。
可选的,所述过滤所述账号信息,剔除脏数据包括:
统计所述账号信息的数量、分布及比例并按照时间顺序进行序列化显示;
所述账号信息的数量大于设定阈值时,过滤所述账号信息。
可选的,所述对过滤后的所述账号信息基于所述URL信息和Refferer消息在设定的时间间隔生成Session,包括:
提取所述URL信息、所述账号信息和所述Refferer消息,并根据时间顺序进行排序;
在设定的时间阈值内,根据所述Refferer消息,将具备跳转关系的所述URL信息串联,形成所述Session。
可选的,所述账号信息组包括主账号和从账号;所述账号信息组的关联关系采用权重值表示,所述账号信息组出现一次,对应的所述权重值加一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于晶赞广告(上海)有限公司,未经晶赞广告(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510673339.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于局部敏感哈希的主题标签快速赋予方法
- 下一篇:一种报警系统