[发明专利]用户行为分析方法、装置、设备及存储介质在审
申请号: | 201911048809.0 | 申请日: | 2019-10-29 |
公开(公告)号: | CN110752958A | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 陈大伟;汪明玮 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 31340 上海光栅知识产权代理有限公司 | 代理人: | 马雯雯 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标数据 目标应用程序 身份标识 维度 用户行为分析 用户终端 匹配度 用户行为数据 存储介质 数据处理 发送 分析 | ||
1.一种用户行为分析方法,其特征在于,包括:
接收多个用户终端中每个用户终端发送的至少一个目标应用程序中的目标数据;
在多个维度上对所述目标数据进行数据处理,得到所述目标数据在每个所述维度上的匹配度;
根据所述目标数据在每个所述维度上的匹配度,确定在各个所述目标应用程序中属于同一个用户的多个身份标识;
根据所述多个身份标识,确定所述多个身份标识对应的用户在各个目标应用程序上的用户行为数据。
2.根据权利要求1所述的方法,其特征在于,所述目标数据包括发表数据、用户头像以及用户昵称,所述多个维度包括发表数据维度、头像维度以及昵称维度。
3.根据权利要求2所述的方法,其特征在于,所述在多个维度上对所述目标数据进行数据处理,得到所述目标数据在每个所述维度上的匹配度,包括:
根据所述目标数据中的发表数据,确定所述发表数据的重合数据和/或重合率,将所述重合数据和/或重合率作为所述目标数据在所述发表数据维度上的匹配度;
根据所述目标数据中的用户头像,通过局部敏感哈希计算,得到各个所述用户之间所述用户头像的特征值的相似度,将所述用户头像的特征值的相似度作为所述目标数据在所述头像维度的匹配度;
根据所述目标数据中的昵称,获得各个所述用户之间对应的所述昵称的相似度,将所述昵称的相似度作为所述目标数据在所述昵称维度上的匹配度。
4.根据权利要求3所述的方法,其特征在于,所述发表数据包括,所述发表数据包括文章、图片、视频中至少一项,所述发表数据的个数为至少一个;
所述根据所述目标数据中的发表数据,确定所述发表数据的重合数据和/或重合率,包括:
从各个所述目标应用程序中确定参考应用程序,所述参考应用程序为各个所述目标应用程序中任一个所述目标应用程序;
将所述参考应用程序上各个用户对应的至少一个所述发表数据分别与各个所述目标应用程序中其他目标应用程序上各个用户对应的至少一个所述发表数据进行聚类,得到所述参考应用程序上各个用户对应的每个所述发表数据的聚类结果,每个所述发表数据的聚类结果中包含各个所述目标应用程序中其他目标应用程序上的多个目标用户的身份标识;
根据所述参考应用程序上的每个所述用户对应的各个所述聚类结果,统计所述多个目标用户的身份标识中的每个目标用户的身份标识在所述参考应用程序上的每个所述用户对应的各个所述聚类结果中出现的次数;
将所述次数作为在所述参考应用程序上的每个所述用户对应的至少一个所述发表数据的重合数据;
对所述重合数据与所述重合数据对应的在所述参考应用程序上的用户通过所述用户终端发表的至少一个所述发表数据的数目做比值,将所述比值作为在所述参考应用程序上的每个所述用户对应的至少一个所述发表数据的重合率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911048809.0/1.html,转载请声明来源钻瓜专利网。