[发明专利]互联网用户主动访问行为轨迹的分析方法有效
申请号: | 201410621994.9 | 申请日: | 2014-11-07 |
公开(公告)号: | CN104298782B | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 孙宏;季海东;赵晓波;董童霖;赵宇龙 | 申请(专利权)人: | 郭磊 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F9/44 |
代理公司: | 北京市中银律师事务所11423 | 代理人: | 修雪静 |
地址: | 110020 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种互联网用户主动访问行为轨迹的分析方法,属于大数据分析领域。本发明根据用户访问互联网的DPI分光数据,构造用户会话(session),通过用户行为分析,分析出用户主动访问互联网的行为轨迹(即Click行为轨迹)以及连带产生的附属页面的方法。本发明的核心技术是如何判断click页面集合中哪些是点击(click)页面,哪些是由点击页面连带产生的附属页面(Hits或PageViews)。通过该方法可以直观、清晰地分析用户主动访问互联网的行为轨迹。 | ||
搜索关键词: | 互联网 用户 主动 访问 行为 轨迹 分析 方法 | ||
【主权项】:
互联网用户主动访问行为轨迹的分析方法,其特征在于,包括如下步骤:(1)读取原始数据:从运营商的深度包检测DPI分光数据中读取海量的用户互联网访问记录,生成用户访问记录文件,该访问记录以访问时间为序;(2)初始赋值:赋值click页面集合中两两页面URL间的最大时间间隔阈值Tmax,同时预置i=1;(3)确定click页面集合:对于用户的访问可以模拟成用户会话Session,当会话中两两页面URL间的时间间隔≥Tmax时,此间隔点前的页面集合为该用户会话Session中的第i个click页面集合Pi{URL1,URL2,…,URLj,…};(4)判断click页面:调用“click点击知识库”的知识,根据“click点击页面推理机”推理集合Pi中有无click点击页面:若推理成功,则确认该页面为click点击页面,即URL(i)click←URL(k)knowledge,其中k为知识库中第k条知识;若推理不成功,则计算集合Pi中的所有页面referer包含集合内其他页面数Count(URLj)referrer,取最大的Count(URLj)referrer为点击页面,即URL(i)click←Max{Count(URLj)referrer};(5)生成用户行为轨迹:若在用户会话中还有click页面集合,则赋值i←i+1,返回步骤(3)重复构造click页面集合;若用户会话中没有click页面集合,则用户行为轨迹分析完毕,生成该用户主动访问行为轨迹URL(i)click,其中i=1,2,……,N。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郭磊,未经郭磊许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410621994.9/,转载请声明来源钻瓜专利网。