[发明专利]一种统计网页链接点击数据的方法有效
申请号: | 200610081086.0 | 申请日: | 2006-05-25 |
公开(公告)号: | CN101079768A | 公开(公告)日: | 2007-11-28 |
发明(设计)人: | 谭颖亮 | 申请(专利权)人: | 阿里巴巴公司 |
主分类号: | H04L12/28 | 分类号: | H04L12/28 |
代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 逯长明 |
地址: | 开曼群岛大*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 统计 网页 链接 点击 数据 方法 | ||
技术领域
本发明涉及网络信息数据的统计方法,特别是涉及一种利用日志文件,统计网页内属于该网站的各链接点击次数的方法。
背景技术
随着网络技术的发展并日趋成熟,网络应用的领域越来越广泛。其中,电子商务的兴起,是最典型的应用。服务提供商都建有自己的网站,并将大量的商务信息发布在网站上,向更多的用户提供网络服务。因而,网站内容的设置、页面信息的及时更新、网站链接是否便捷等,都直接影响着服务提供商对用户的服务质量,从而影响了商务的成交。因此,网站的维护管理至关重要。服务提供商不仅希望了解网站各网页的访问情况,还希望了解网页内各链接的点击情况,以便合理安排页面上的内容,将用户经常访问的链接置于显著位置,将很少访问的链接置于页面角落或清除出该页面,改善网页的内容和质量,提高内容的可读性,从而提高网站的访问量。
网站的运行由Web服务器来实现,现在较常用的Web服务器包括Apache、IIS和Iplanet的企业服务器。通常,可以由一个或多个Web服务器来管理同一网站的运行。对网站的管理,可通过对web服务器的日志文件的分析和统计来实现。日志文件(Log files)是包含关于系统消息的文件,包括内核、服务、在系统上运行的应用程序等。不同的日志文件记载不同的信息,例如,有的是默认的系统日志文件,有的仅用于安全消息。目前,市场上公开源码的Webalizer、AWstats等日志分析软件,通过对某网站web服务器的日志文件的分析,能够统计出任一时段内某网页的访问点击次数。
如图1所示,是现有技术统计页面访问量的步骤流程图。万维网(WWW)的工作基于客户机/服务器计算模型,由Web浏览器(客户机)和Web服务器(服务器)构成,两者之间采用超文本传输协议(HTTP)进行通信。当用户访问某网站时,在Web浏览器输入该网站的网址或点击该网站的链接,浏览器向要访问的网站的Web服务器发送HTTP请求。步骤101,Web服务器收到HTTP请求后,分析该请求的请求头文件(request-header files)。步骤102,从请求头文件的请求头(request-header)中记录统计所需的数据,包括目标统一资源定位符URL及请求时间。所述统一资源定位符URL也被称为网页地址,是用在万维网和其他互联网资源中的一种编址系统,用于指定信息位置,包含访问方式的信息、被访问的服务器以及任何被访问的文件。其中,目标URL指要访问的网页地址。步骤103,Web服务器生成日志文件,包含多条记录,其中每条日志记录都包含目标URL字段及请求时间字段。步骤104,确定要统计的网页的URL及统计时间间隔。步骤105,按照统计时间,在日志文件中逐条查找目标URL字段为要统计的URL的记录,统计符合条件的各自相同目标URL的记录数量。
上述统计方法是通过分析日志文件来获取目标URL数据,先按照统计条件提取目标URL字段中的数据,再统计同一目标URL的记录数,从而获得页面访问量。而且,还可以在此基础上,对统计结果进行降序排序,以统计出访问量最高的页面,或者根据其他不同需求,按照其他方式排序。
但是,上述方法只能够帮助服务提供商了解网站各网页的访问量,而无法了解网页内各链接的点击情况。目前,现有的日志分析软件或者分析方法都无法统计出某页面中属于本网站的各链接的点击次数。
发明内容
本发明所要解决的技术问题是提供一种统计网页内各链接点击数据的方法,用于统计某网站的某网页内属于本网站的各链接的点击次数。
为解决上述技术问题,本发明提供了一种统计网页链接点击数据的方法,包括:
A、通过Web服务器生成日志文件来获取包含源网页地址和目标网页地址的原始数据;
B、查找原始数据中源网页地址为需要统计的网页地址的记录,所述记录包括原URL、若干个目标URL和请求时间数据;
C、针对同一源网页地址记录的若干个目标网页地址,统计各目标网页地址相同的记录的数量。
其中,所述的原始数据包含在链接请求的请求头文件中。
其中,所述链接请求为HTTP请求。
其中,所述日志文件中的目标网页地址属于同一个网站。
可选的,步骤B与步骤C之间还包括,保存记录中所有不同的目标网页地址。
可选的,所述方法还包括,输出统计结果到文件。
其中,所述原始数据还包括请求时间。
其中,所述统计按照预定的时间间隔进行。
与现有技术相比,本发明具有以下优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴公司,未经阿里巴巴公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610081086.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:码分多址网络中异构系统的接入方法
- 下一篇:采用机械手检测ADSL的控制装置