[发明专利]一种基于访问行为的活跃用户识别方法有效
申请号: | 201610542319.6 | 申请日: | 2016-07-11 |
公开(公告)号: | CN106210044B | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 许哲熙 | 申请(专利权)人: | 焦点科技股份有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
地址: | 210003 江苏省南京市高新*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于访问行为的活跃用户识别方法,步骤如下:1)解析用户访问日志,提取用户的有用信息:包含用户ID、用户姓名、用户访问时间、用户访问模块URL;2)统计用户模块访问次数;3)过滤冗余用户和访问模块,根据得到的每个用户每日模块的访问次数,由于用户的数量远远大于模块的数量,用户‑模块访问组成的矩阵将会是一个高维稀疏的矩阵,对矩阵进行优化,舍掉不必要的特征,只留下核心模块;4)划分用户身份,采用聚类领域的相关算法对用户进行划分;考虑到只需要将用户划分成活跃用户和非活跃用户,采用K‑means算法,其中K=2,进行活跃用户划分。 | ||
搜索关键词: | 一种 基于 访问 行为 活跃 用户 识别 方法 | ||
【主权项】:
1.一种基于访问行为的活跃用户识别方法,其特征是,步骤如下:1)解析用户访问日志,访问日志来自于数据库中的日志表;解析用户访问日志,提取用户的有用信息:包含用户ID、用户姓名、用户访问时间、用户访问模块URL;2)统计用户模块访问次数,首先应在数据库中建立一张访问模块信息的维表,该维表应该包含各级模块的URL地址以及各级模块之间的对应关系;访问的模块有一级至三级从高级到低级的模块结构,若一级模块名称、二级模块名称、三级模块中有上下级模块缺失,应进行必要的补充;然后,依据之前提取访问日志信息,匹配模块维表,统计用户每天在不同模块的访问次数;3)过滤冗余用户和访问模块,因用户的数量远远大于模块的数量,用户‑模块访问组成的矩阵将会是一个高维稀疏的矩阵,根据得到的每个用户每日对模块的访问次数,对矩阵进行优化:第一是面向用户,根据访问量统计用户频数分布,把频数和访问量同时较小的用户过滤掉,第二是面向模块,利用SVD技术对模块维度进行特征抽取,舍掉不必要的特征,只留下核心模块;4)划分用户身份,采用聚类领域的相关算法对用户进行划分;考虑到只需要将用户划分成活跃用户和非活跃用户,故采用K‑means算法,其中K=2,进行活跃用户划分。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610542319.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种用户之间直接传播应用程序的方法
- 下一篇:应用程序下载量确定方法及装置