[发明专利]用户识别方法与装置无效
申请号: | 201210593226.8 | 申请日: | 2012-12-31 |
公开(公告)号: | CN103051637A | 公开(公告)日: | 2013-04-17 |
发明(设计)人: | 罗峰;黄苏支;李娜 | 申请(专利权)人: | 北京亿赞普网络技术有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 兰淑铎 |
地址: | 100081 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 识别 方法 装置 | ||
技术领域
本发明涉及网络技术领域,特别是涉及一种用户识别方法与装置。
背景技术
目前随着互联网技术应用的越来越广泛,人们很多的日常工作和娱乐都在网络上进行。在很多网络应用场景下,用户在访问网络时,服务器需要对用户进行识别。较为广泛采用的用户识别方法包括通过IP地址识别、通过ADSL账号识别和通过网站的COOKIE识别等。
其中,通过IP地址识别用户时,由于IP资源有限,而上网用户却越来越多,目前的宽带用户一般都使用动态IP,以避免用户不上网也占用宝贵的IP资源,这样,就造成同一个IP地址被多个不同用户使用,无法准确识别用户。
通过ADSL账号识别用户时,通常与UA(用户使用的浏览器版本)相结合,但是这种通过ADSL+UA的方式的粒度太粗,会出现一个ADSL对应多个用户,同样难以精确确定用户。
当通过网站的COOKIE识别用户时,网站采用COOKIE技术跟踪用户在本网站下的行为,然而每个网站只能跟踪用户在本网站或者是嵌入本网站COOKIE的第三方网站的访问行为,无法对整个互联网的用户行为进行跟踪,因而也无法准确识别用户。
可见,不论上述哪种情况,都无法达到准确识别用户,而只有服务器能够准确识别客户端和用户,才能进行后续的高精度操作,如高精度投放广告等,以减低信息交互成本和信息交互量,提升用户对网络的访问体验。
发明内容
本发明提供了一种用户识别方法与装置,以解决现有方案无法准确识别用户的问题。
为了解决上述问题,本发明公开了一种用户识别方法,包括:从网络访问日志报文中获取设定时间段内用户标识相同,且所述用户标识与设定网站的网站COOKIE一一对应的报文;从获取的所述报文中获取四元组信息,其中,所述四元组信息包括所述用户标识指示的用户访问网站的域名、所述用户标识、所述用户访问网站的COOKIE字段、和所述COOKIE字段的值;对所述四元组信息进行统计,获得每个所述用户访问网站的访问信息;对所述每个用户访问网站的访问信息进行过滤,获取所述每个用户访问网站标识所述用户的COOKIE字段;建立获取的所述COOKIE字段与所述用户标识的对应关系,根据所述对应关系识别所述用户。
优选地,所述用户标识包括用户账号和浏览器版本号;所述用户访问网站的访问信息包括:所述用户访问网站的域名、所述域名的页面浏览量、所述域名的页面浏览量占比、所述用户访问网站的COOKIE字段、用户标识相同的页面浏览次数、用户标识不同的页面浏览次数、所述用户标识不同的页面浏览次数比例、用户标识相同的独立访客次数、用户标识不同的独立访客次数、所述用户标识不同的独立访客比例。
优选地,在所述对所述每个用户访问网站的访问信息进行过滤的步骤之前,还包括:按照所述用户标识不同的页面浏览次数比例和/或所述用户标识不同的独立访客比例对所述每个用户访问网站的访问信息进行排序。
优选地,所述对所述每个用户访问网站的访问信息进行过滤,获取所述每个用户访问网站标识所述用户的COOKIE字段的步骤包括:使用所述域名的页面浏览量、或者互信息,或者信息增益,对所述每个用户访问网站的访问信息进行过滤,获取所述每个用户访问网站标识所述单用户的COOKIE字段。
优选地,所述用户识别方法还包括:根据所述获取的报文,获取COOKIE名相同的两个网站的网站访问信息,其中,所述网站访问信息包括:所述两个网站的COOKIE字段、所述COOKIE字段的值、所述两个网站的域名、用户标识相同的页面浏览次数、用户标识不同的页面浏览次数、所述用户标识不同的页面浏览次数比例、用户标识相同的独立访客次数、用户标识不同的独立访客次数、所述用户标识不同的独立访客比例;按照所述用户标识不同的页面浏览次数比例和/或所述用户标识不同的独立访客比例对所述两个网站的访问信息进行排序;对排序后的所述访问信息进行过滤,确定所述两个网站是否使用相同的COOKIE字段;若是,则建立所述两个网站的关联,根据所述关联和所述COOKIE字段与所述用户标识的对应关系识别所述用户。
优选地,所述用户识别方法还包括:若用于标识所述用户的所述COOKIE字段包括多个COOKIE字段的值,则在所述多个COOKIE字段的值之间进行关联;根据所述关联和所述COOKIE字段与所述用户标识的对应关系识别所述用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京亿赞普网络技术有限公司,未经北京亿赞普网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210593226.8/2.html,转载请声明来源钻瓜专利网。