[发明专利]确定用户标识的关联性的方法和装置有效

专利信息
申请号: 201510971532.4 申请日: 2015-12-22
公开(公告)号: CN105608179B 公开(公告)日: 2019-03-12
发明(设计)人: 杜伟夫;贺杨成;黄跃峰 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G06F16/28 分类号: G06F16/28
代理公司: 北京英赛嘉华知识产权代理有限责任公司 11204 代理人: 王达佐;马晓亚
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 确定 用户 标识 关联性 方法 装置
【说明书】:

本申请公开了一种确定用户标识的关联性的方法和装置。所述方法的一具体实施方式包括:分别提取待确定关联性的多组用户标识的相似度向量;利用预先训练的关联度模型将所述相似度向量进行计算得到第一关联度;基于所述第一关联度对所述待确定关联性的多组用户标识分别生成预确定关联关系;根据所述预确定关联关系,将所述待确定关联性的多组用户标识的相似度向量作为更新样本集对所述关联度模型更新得到预测模型;对待确定关联性的各组用户标识,分别利用所述预测模型对所述相似度向量进行计算得到第二关联度;对于第二关联度大于预设阈值的各组用户标识,确定组内的用户标识间具有关联性。该实施方式可以提高确定用户标识的关联性的准确性。

技术领域

本申请涉及计算机技术领域,具体涉及信息匹配技术领域,尤其涉及一种确定用户标识的关联性的方法和装置。

背景技术

随着互联网技术的发展,各种网络平台,例如网络社交平台(如QQ社交平台)、搜索平台(如必应搜索平台)、网上交易平台(如京东商城)等等,逐渐成为人们生活的重要组成部分。用户可以通过相同或不同的账号或终端设备等访问各种网络平台。这些账号或终端设备的标识信息等可以用用户标识(identification,ID)来表示。对这些用户标识之间的关联性进行分析,具有应用于各种领域的重要意义,例如网页广告推送、网络社交平台中的好友推荐、犯罪分子追踪等等。

现有的确定用户标识的关联性的方法中,通常将用户标识两两之间的属性信息相匹配从而确定其是否相关联。然而,这种匹配方法,往往通过已确定关联性的用户标识预先训练的模型对待确定关联性的用户标识进行预测,建立在已确定关联性的用户标识之间的关联关系与待确定关联性的用户标识之间的关联关系具有相同的规律和分布的假设基础上。因此,这种匹配方法没有考虑待确定关联性的用户标识之间的关联关系对预测模型的影响,导致在上述假设不成立时,确定的用户标识的关联性准确度不高。

发明内容

本申请的目的在于提出一种改进的方法和装置,来解决以上背景技术部分提到的技术问题。

一方面,本申请提供了一种确定用户标识的关联性的方法,所述方法包括:分别提取待确定关联性的多组用户标识的相似度向量,其中,每组用户标识包括至少两个用户标识;利用预先训练的关联度模型将各个相似度向量进行计算分别得到第一关联度;基于所述第一关联度对所述待确定关联性的多组用户标识分别生成预确定关联关系;根据所述预确定关联关系,将所述待确定关联性的多组用户标识作为更新样本集对所述关联度模型更新得到预测模型;对待确定关联性的各组用户标识,分别利用所述预测模型对所述相似度向量进行计算得到第二关联度;对于第二关联度大于预设阈值的各组用户标识,确定组内的用户标识间具有关联性。

在一些实施例中,所述分别提取待确定关联性的多组用户标识的相似度向量包括:针对各组用户标识,执行如下步骤:获取每个用户标识的属性信息;对所述属性信息中的每一项,计算用户标识之间的属性相似度;由所述属性相似度生成所述相似度向量。

在一些实施例中,所述基于所述第一关联度对所述待确定关联性的多组用户标识分别生成预确定关联关系包括:对所述第一关联度通过聚类算法进行分类,以将所述待确定关联性的多组用户标识分为两类;根据分类结果对所述多组用户标识生成预确定关联关系。

在一些实施例中,所述聚类算法的聚类中心通过迭代方法计算得到,具体方法包括:查找步骤:遍历待确定关联性的各组用户标识,查找使下列函数具有最小值的一组用户标识,加入集合c(i)

其中,x(i)表示第i组用户标识的相似度向量;μj表示集合c(i)所代表聚类的聚类中心的相似度向量;表示第i组用户标识的第一关联度;表示集合c(i)所代表聚类的聚类中心的第一关联度;λ表示第一关联度的权重;计算步骤:对于集合c(i)中的至少一组用户标识,计算各组用户标识的相似度向量的平均值,具体计算公式为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510971532.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top