[发明专利]识别用户点击行为的方法及网关设备有效
| 申请号: | 201210464845.7 | 申请日: | 2012-11-16 |
| 公开(公告)号: | CN103825772B | 公开(公告)日: | 2017-06-06 |
| 发明(设计)人: | 陈潇;张晋兴;胡玉胜 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L12/66 |
| 代理公司: | 北京弘权知识产权代理事务所(普通合伙)11363 | 代理人: | 逯长明,许伟群 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 识别 用户 点击 行为 方法 网关 设备 | ||
1.一种识别用户点击行为的方法,其特征在于,所述方法包括步骤:
获取用户浏览页面的HTML数据;
解析所述页面的HTML数据,提取其中的URL并解析各URL的类型,生成链接URL列表和/或资源URL列表;
识别对应于所述页面的GET请求中的URL,若所述GET请求中的URL在所述链接URL列表中或者所述GET请求中的URL不在所述资源URL列表中,将所述GET请求识别为一次用户点击行为;
所述获取用户浏览页面的HTML数据包括:
通过解析GET请求的响应报文获取所述页面的HTML数据;
所述解析GET请求的响应报文包括:
解析所述响应报文的Content-type字段,若为text/html,则进一步解析所述响应报文的Content-Encoding字段,若所述Content-Encoding字段提供了压缩格式,则依据所述压缩格式对所述响应报文的内容进行解压;
以及,解析所述响应报文的Transfer-Encoding字段,若所述Transfer-Encoding字段提供了传输的编码方式,则基于所述编码方式对解压后的所述响应报文的内容进行解码。
2.根据权利要求1所述的方法,其特征在于,所述解析各URL的类型包括:
通过所述各URL对应的HTML标记的格式特征解析所述各URL的类型。
3.根据权利要求2所述的方法,其特征在于,所述通过所述各URL对应的HTML标记的格式特征解析所述各URL的类型包括:
通过正则表达式匹配所述HTML标记的格式特征来解析所述各URL的类型。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述方法还包括:
将所述GET请求中的URL转换为ASCII编码的字符串。
5.一种网关设备,其特征在于,所述网关设备包括:
获取单元,用于从WEB服务器发给用户端设备的数据中获取用户浏览页面的HTML数据,并将所述HTML数据传输给解析单元;
解析单元,用于从所述获取单元接收所述HTML数据,解析所述HTML数据,提取其中的URL并解析各URL的类型,生成链接URL列表和/或资源URL列表传输给识别单元;
识别单元,用于从所述解析单元接收所述链接URL列表或所述资源URL列表,从用户端设备发给WEB服务器的GET请求中识别对应于所述页面的GET请求中的URL,若所述GET请求中的URL在所述链接URL列表中或者所述GET请求中的URL不在所述资源URL列表中,将所述GET请求识别为一次用户点击行为;
所述获取单元,还用于通过解析GET请求的响应报文获取所述页面的HTML数据;
所述解析单元中进一步包括字段解析单元,所述字段解析单元用于解析所述响应报文的Content-type字段,若为text/html,则进一步解析所述响应报文的Content-Encoding字段,若所述Content-Encoding字段提供了压缩格式,则依据所述压缩格式对所述响应报文的内容进行解压;
所述字段解析单元还用于解析所述响应报文的Transfer-Encoding字段,若所述Transfer-Encoding字段提供了传输的编码方式,则基于所述编码方式对解压后的所述响应报文的内容进行解码。
6.根据权利要求5所述的网关设备,其特征在于,所述识别单元中还包括字符转换单元,用于将所述GET请求中的URL转换为ASCII编码的字符串。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210464845.7/1.html,转载请声明来源钻瓜专利网。





