[发明专利]社交网站交互行为收集检测方法在审
申请号: | 201511008360.7 | 申请日: | 2015-12-29 |
公开(公告)号: | CN105404697A | 公开(公告)日: | 2016-03-16 |
发明(设计)人: | 董政;吴文杰;陈露;李学生 | 申请(专利权)人: | 成都陌云科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00;G06Q30/02 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 郭霞 |
地址: | 610041 四川省成都市高*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 网站 交互 行为 收集 检测 方法 | ||
技术领域
本发明涉及大数据,特别涉及一种社交网站交互行为收集检测方法。
背景技术
近年来移动互联网、电子商务、物联网迅猛发展,用户在网上可获取的消息越来越多,互联网中有海量的信息内容,用户为了找到自己真正感兴趣和需要的信息,不得不花费巨大的时间和精力去筛选这些信息,甚至可能还会由于搜索不当导致用户错过或漏选真正感兴趣的信息。因此需要一种根据自身在网络中的行为习惯和兴趣爱好,能够自动为用户提供用户需要的信息的服务。比如网络商家,当商家在网络中发布自己的商品信息,而对此感兴趣的用户又错过了浏览该商品的机会,商家就丧失了一次可能进行商品交易的机会,因此商家也需要网络能够提供一种自动将其发布的商品信息提供给对商品可能感兴趣的用户的服务。传统的技术方案对用户在网络中的行为习惯和兴趣爱好进行分析,实现信息推送。而只是记录了用户的上网记录,访问了哪些服务器的哪些页面。这些信息不能很明显地展示用户的兴趣爱好。而通过第三方网站跟踪用户的用户识别方法只考虑了商家的需求,没有考虑用户的信息安全;根据用户上网的行为模式判断新会话属于哪个用户的方法只是分析了动态的会话,而且当数据量庞大时,由于缺少识别用户的信息,仅依靠用户的行为模式,不能进行用户识别。
发明内容
为解决上述现有技术所存在的问题,本发明提出了一种社交网站交互行为收集检测方法,包括:
对用户在网站中的日志进行识别分析,提取用户端缓存数据的相关字段,与识别出的用户会话结合进行用户行为检测。
优选地,所述对用户在网站中的日志进行识别分析,进一步包括:
用表root来存储已经处理过的记录的URL及其访问时间,用Reference表示用户是从哪一个页面链接到当前页面,则满足下面两个条件A和B的记录判断为属于同一个会话:
A:当前记录的Reference在root表中出现过;并且
B:当前记录的访问时间和root表中同样URL记录的访问时间差不超过预定时间;
如果root集合中有多条记录的URL和己经处理的记录的Reference相匹配,则取与该条记录时间差最小的记录;
然后按照以下过程进行会话识别:
1)在日志中添加一个会话标识字段SID,同时创建一个root表,表的记录格式为<己访问记录URL,时刻Time,会话标识SID>;
2)读入一行新记录R,判断其是否为第一条记录,如果是第一条记录,转3);如果不是第一条记录转4);
3)将记录R的URL和Time插入root表,新建SID,即root新增一条记录,并将该SID的值赋给记录R,返回步骤2);
4)判断记录R的Reference字段是否为空,若为空值,则转3);若非空,转5);
5)提取记录R的Reference字段的值,并遍历root表,检查R的Reference值是否在root的URL字段中存在,若不存在,则转3),否则,转6);
6)遍历root表时,检查R的Reference值与root表URL字段是否有多条记录相同,如果只有一条记录,记作S,则转7);否则转8);
7)将记录R的Time值与root表中记录S的Time值进行比较,如果时间差的值大于预设时间,则转3);否则,将记录R的URL和Time字段插入root表,并将记录S的SID赋给此记录R;
8)将6)中得到的多条记录的Time字段与记录R的Time字段进行比较,取与记录R的Time字段值最近的记录,记作S,转7)。
优选地,所述提取用户端缓存数据的相关字段,进一步包括:
将每个网站域名下的客户端缓存数据中保存的与用户名相关的字段设置成一个规则表;在日志中增加了一个Name字段作为客户端缓存数据提取的内容,将该字段非空的日志中每一个不同的Name的第一个会话作为每一个用户的初始聚类中心;
将R={rl,r2,...,rn}表示n条会话记录组成的日志集合;r=[SID,IP,ACC,Agent,Name]表示一条会话记录;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都陌云科技有限公司,未经成都陌云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511008360.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于硬件在环仿真的风电机组建模方法
- 下一篇:图像形成装置