[发明专利]网络访问记录的处理方法、装置和计算机可读存储介质有效
申请号: | 201710608700.2 | 申请日: | 2017-07-25 |
公开(公告)号: | CN109302297B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 郝颖;陈康;田熙清;向勇;陈翀 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | H04L67/02 | 分类号: | H04L67/02;H04L41/0604;H04L41/069;H04L43/16;G06F16/955 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 刘剑波 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 访问 记录 处理 方法 装置 计算机 可读 存储 介质 | ||
1.一种网络访问记录的处理方法,包括:
选取一条网络访问记录作为目标记录,根据所述目标记录的来源页面字段以及其它网络访问记录的目的统一资源定位符URL字段确定对比记录;
在所述目标记录和对比记录的处理时间差小于第一阈值的情况下,将所述目标记录判断为非人为点击记录,清洗掉所述目标记录;
所述选取一条网络访问记录作为目标记录包括:
根据源IP和用户代理User Agent将网络访问记录划分为多个记录集合,从记录集合中选取一条网络访问记录作为所述记录集合的所述目标记录;
所述确定对比记录包括:
在所述目标记录所在的记录集合中确定所述对比记录,响应于所述其它网络访问记录的目的URL字段与所述目标记录的来源页面字段指向同一页面,将所述其它网络访问记录确定为所述对比记录。
2.根据权利要求1所述的处理方法,其中,所述对比记录的处理时间早于所述目标记录的处理时间。
3.根据权利要求1或2所述的处理方法,所述确定对比记录包括:
响应于所述目标记录不具有所述来源页面字段,将与所述目标记录具有相同域名的网络访问记录确定为对比记录。
4.根据权利要求1或2所述的处理方法,还包括:
删除所述处理时间与当前时刻的时间差大于第二阈值的网络访问记录。
5.一种网络访问记录的处理装置,包括:
对比记录确定模块,用于选取一条网络访问记录作为目标记录,根据所述目标记录的来源页面字段以及其它网络访问记录的目的统一资源定位符URL字段确定对比记录;
记录清洗模块,用于在所述目标记录和对比记录的处理时间差小于第一阈值的情况下,将所述目标记录判断为非人为点击记录,清洗掉所述目标记录;
所述对比记录确定模块响应于所述其它网络访问记录的目的URL字段与所述目标记录的来源页面字段指向同一页面,将所述其它网络访问记录确定为所述对比记录;
所述对比记录确定模块在所述目标记录所在的记录集合中确定所述对比记录;
所述对比记录确定模块根据源IP和用户代理User Agent将网络访问记录划分为多个记录集合,从记录集合中选取一条网络访问记录作为所述记录集合的所述目标记录。
6.根据权利要求5所述的处理装置,其中,所述对比记录的处理时间早于所述目标记录的处理时间。
7.根据权利要求5或6所述的处理装置,其中,所述对比记录确定模块响应于所述目标记录不具有所述来源页面字段,将与所述目标记录具有相同域名的网络访问记录确定为对比记录。
8.根据权利要求5或6所述的处理装置,其中,所述记录清洗模块还用于删除所述处理时间与当前时刻的时间差大于第二阈值的网络访问记录。
9.一种网络访问记录的处理装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器装置中的指令,执行如权利要求1-4中任一项所述的网络访问记录的处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-4中任一项所述的网络访问记录的处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710608700.2/1.html,转载请声明来源钻瓜专利网。