[发明专利]网络用户的特征识别方法有效

专利信息
申请号: 201610439205.9 申请日: 2016-06-17
公开(公告)号: CN106126573B 公开(公告)日: 2019-04-02
发明(设计)人: 黄雨;李俊涛 申请(专利权)人: 北京大学
主分类号: G06F16/951 分类号: G06F16/951
代理公司: 北京万象新悦知识产权代理有限公司 11360 代理人: 黄凤茹
地址: 100871*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公布了一种网络用户的特征识别方法,根据网络用户获得网页数据包的大小,通过逆向检测用户访问的网页,识别用户感兴趣的网页类型;包括:获取访问量靠前的网站、设置兴趣类型、定期扫描获得网页和数据包大小、提取网页对并将网页对与数据包大小建立对应、设置网页对的兴趣类型、生成数据包对与网页对兴趣类型的对应数据库、根据IP地址划分数据包、获得网络每次连续访问的网页对、获得连续访问网页对的数据包大小、获取数据库中匹配记录对应的兴趣类型并和IP地址关联、获得该IP地址的兴趣类型作为相应用户的兴趣特征。本发明不需要检测数据包内容,只需获得数据包大小,简单快捷、效率高、准确性高。
搜索关键词: 网络 用户 特征 识别 方法
【主权项】:
1.一种网络用户的特征识别方法,其特征是,根据网络用户获得网页数据包的大小,通过逆向方法检测出用户访问的网页,从而识别出用户感兴趣的网页类型;包括如下步骤:步骤1:获取访问量靠前的N个网站,包括专业性网站和综合性网站;所述综合性网站包含多个频道;步骤2:设置兴趣类型,对上述N个网站或网站的频道标注兴趣类型,建立网站或网站的频道与兴趣类型之间的对应关系;步骤3:定期对确定了兴趣类型的网站或网站的频道进行扫描,获得网页和每个网页的根文件的数据包包头文件中的数据包大小;步骤4:从所获得网页中提取网页对;将网页对与该网页对的数据包大小形成对应关系;步骤5:设置网页对的兴趣类型,形成网页对的兴趣类型和网页对的数据包大小的对应关系,生成网页对的数据包对大小与网页对的兴趣类型的对应数据库;步骤6:获取待检测网络上的所有数据包,根据IP地址来划分数据包;步骤7:设置网络的空闲时间和忙碌时间,定义网络连续访问;步骤8:将一次连续访问中的前一个数据包和后一个数据包作为该次连续访问中的网页对,获得网络每次连续访问的网页对;步骤9:获得网络每次连续访问中网页对的数据包大小;步骤10:在步骤5得到的数据包对大小和兴趣类型的对应数据库中检索步骤9获得的网页对的数据包大小,当检索到匹配数据记录时,获取匹配的数据记录对应的兴趣类型;并将该兴趣类型和IP地址关联;步骤11:通过统计得到与某一IP地址关联的兴趣类型,从而获得该IP地址的兴趣类型,作为所述IP地址相应的网络用户的兴趣特征。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610439205.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top