[发明专利]一种网站分析系统及方法和装置有效
| 申请号: | 201210279722.6 | 申请日: | 2012-08-07 |
| 公开(公告)号: | CN102761450A | 公开(公告)日: | 2012-10-31 |
| 发明(设计)人: | 王宁 | 申请(专利权)人: | 北京鼎震科技有限责任公司 |
| 主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L29/08 |
| 代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 赵建刚 |
| 地址: | 102208 北京市昌平*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 网站 分析 系统 方法 装置 | ||
技术领域
本发明涉及通信技术领域,尤其涉及一种网站分析系统及方法和装置。
背景技术
网站分析(Web Analytics)是一种对网站访客行为的研究。通过获得了基本的流量数据,从中发现网站访客的规律和问题。通过网站分析,可以有效的达到监控流量、吸引流量、保留流量的作用。
现在技术中网站分析通常采用日志分析法和页面标记法两种方式:
关于日志分析法:日志分析法利用WEB服务器保存的访问日志文件作为原始的数据输入源,分析访客的浏览和访问行为。
日志分析法的基本流程是:
1、首先需要在web服务器(例如Appache、ISS等)配置WEB日志格式,通过web服务器记录用户访问的信息;
2、将保存于服务器上的日志记录通过FTP等协议保存到本地的某台机器上;
3、在保存了日志的机器上运行日志分析软件;
4、日志分析软件读取日志记录,通过日志记录的还原分析可以获得访客的浏览和访问行为。
关于页面标记法:页面标记法需要在被统计的页面中嵌入一小段脚本,这个脚本的作用就是收集必要的用户访问数据,然后将用户访问的数据发送到特定的服务器上进行分析。
页面标记法的基本流程:
1、在需要被统计的页面中嵌入一段采用JS语言开发脚本;
2、当用户浏览网页的同时,浏览器同时解析执行这段嵌入到网页的脚本;
3、这个脚本会触发一次新的HTTP请求,该请求会携带一些内容到一台专门用于网站分析的服务器上,内容通常会包括该用户的IP地址、访问的URL、用户的浏览器等信息,并通过Cookies记录一些用户信息。
用于网站分析的服务器本身也是一台WEB服务器,该服务器会接收脚本发来的请求,将请求携带的内容记录在服务器上,可以获得访客的浏览和访问行为。
这两种分析方法存在的弊端是
1、日志分析法需要web服务器开启日志保存功能,增加了web服务器的性能负担;
2、日志分析法由于需要取得服务器日志信息之后才可以提供网站分析结果,因此网站日志分析法无法获得实时的分析结果;
3、页面标记法需要在每个需要分析的页面中嵌入一段JS代码,增加了技术实施的复杂度;
4、页面标记法无法统计爬虫、攻击等行为,如果用户的浏览器安全级别要求较高,或者不允许JS脚本执行,也会导致页面标记法无法完成统计功能;因为这些访问不会触发JS脚本的执行;
5、页面标记法一般都是通过第三方网站提供的脚本来完成统计分析服务,这样有可能会导致网站的一些敏感信息被第三方获取;
6、页面标记法的脚本都会采用Cookies的模式记录用户信息,其中有些是采用第一方Cookies,有些采用第三方Cookies。其中第一方Cookies会增加网站负担,第三方Cookies会带来用户隐私泄漏的风险。
发明内容
本发明的目的在于提供一种基于旁路镜像的网站分析系统及方法和装置,从而解决现有技术中存在的前述问题。本发明采用独具创新的模式完成网站分析的数据采集。对用户访问网站的数据进行“旁路镜像”,可以获得用户访问网站的原始数据包信息,经过有效的数据清理、筛选,获得完整的网站分析的数据报告。本发明可以对网站的流量进行最全面的分析,包括网站的攻击流量、网络爬虫、恶意的机器人访问等等情况。无需网站修改任何代码,没有任何的安全风险。
传统组网模型就是在交换机上接入相关的WEB服务器,由WEB服务器实体来完成相关的网站分析等功能;而本发明的技术组网方案在交换机上旁路部署了一个设备实体,由该设备实体来完成网站分析的功能,WEB服务器实体仅需要完成网站的信息应答功能。
本发明公开的技术方案具体如下:
一种网站分析系统,包括防火墙、网络交换机和web服务器,所述网络交换机为具备镜像端口的网络交换机,所述镜像端口上连接有网站分析服务器;所述镜像端口用于通过流量镜像方式获取连接有所述网站分析服务器的通讯端口的通讯数据。
优选的,所述网站分析服务器包括流量采集模块、http协议分析模块、Request报文分析模块、Response报文分析模块、访问信息收集模块和网站分析基础数据库;所述流量采集模块、所述http协议分析模块、所述Request报文分析模块、所述Response报文分析模块、所述访问信息收集模块和所述网站分析基础数据库顺序连接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京鼎震科技有限责任公司,未经北京鼎震科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210279722.6/2.html,转载请声明来源钻瓜专利网。





