[发明专利]网络用户的特征识别方法有效
申请号: | 201610439205.9 | 申请日: | 2016-06-17 |
公开(公告)号: | CN106126573B | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 黄雨;李俊涛 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公布了一种网络用户的特征识别方法,根据网络用户获得网页数据包的大小,通过逆向检测用户访问的网页,识别用户感兴趣的网页类型;包括:获取访问量靠前的网站、设置兴趣类型、定期扫描获得网页和数据包大小、提取网页对并将网页对与数据包大小建立对应、设置网页对的兴趣类型、生成数据包对与网页对兴趣类型的对应数据库、根据IP地址划分数据包、获得网络每次连续访问的网页对、获得连续访问网页对的数据包大小、获取数据库中匹配记录对应的兴趣类型并和IP地址关联、获得该IP地址的兴趣类型作为相应用户的兴趣特征。本发明不需要检测数据包内容,只需获得数据包大小,简单快捷、效率高、准确性高。 | ||
搜索关键词: | 网络 用户 特征 识别 方法 | ||
【主权项】:
1.一种网络用户的特征识别方法,其特征是,根据网络用户获得网页数据包的大小,通过逆向方法检测出用户访问的网页,从而识别出用户感兴趣的网页类型;包括如下步骤:步骤1:获取访问量靠前的N个网站,包括专业性网站和综合性网站;所述综合性网站包含多个频道;步骤2:设置兴趣类型,对上述N个网站或网站的频道标注兴趣类型,建立网站或网站的频道与兴趣类型之间的对应关系;步骤3:定期对确定了兴趣类型的网站或网站的频道进行扫描,获得网页和每个网页的根文件的数据包包头文件中的数据包大小;步骤4:从所获得网页中提取网页对;将网页对与该网页对的数据包大小形成对应关系;步骤5:设置网页对的兴趣类型,形成网页对的兴趣类型和网页对的数据包大小的对应关系,生成网页对的数据包对大小与网页对的兴趣类型的对应数据库;步骤6:获取待检测网络上的所有数据包,根据IP地址来划分数据包;步骤7:设置网络的空闲时间和忙碌时间,定义网络连续访问;步骤8:将一次连续访问中的前一个数据包和后一个数据包作为该次连续访问中的网页对,获得网络每次连续访问的网页对;步骤9:获得网络每次连续访问中网页对的数据包大小;步骤10:在步骤5得到的数据包对大小和兴趣类型的对应数据库中检索步骤9获得的网页对的数据包大小,当检索到匹配数据记录时,获取匹配的数据记录对应的兴趣类型;并将该兴趣类型和IP地址关联;步骤11:通过统计得到与某一IP地址关联的兴趣类型,从而获得该IP地址的兴趣类型,作为所述IP地址相应的网络用户的兴趣特征。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610439205.9/,转载请声明来源钻瓜专利网。