[发明专利]点击日志的生成方法及装置,搜索结果调整方法及装置在审
申请号: | 201110289117.2 | 申请日: | 2011-09-26 |
公开(公告)号: | CN103020087A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 金敬亭;乔敏 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 点击 日志 生成 方法 装置 搜索 结果 调整 | ||
技术领域
本发明涉及互联网技术领域,特别涉及一种点击日志的自动生成方法及装置,以及利用该点击日志进行搜索结果调整的方法及装置。
背景技术
在web应用领域之中,为了得到用户的行为,往往需要在页面上做一些监控,以记录用户的点击行为。这样,每次点击都将会产生一条点击日志,并将该点击日志发送给服务器端。后续,服务器端就可以根据大量的用户点击行为进行分析,并根据分析结果获得什么样的检索结果更好,用户更喜欢,从而提高用户的满意度。
目前,对于验证测试页面中点击统计功能是否正常,或者生成点击日志的功能来说,主要还是通过手工的方式。例如,首先通过人工打开待测页面,并通过手动方式点击待测页面里面的URL(Uniform Resource Locator,统一资源定位符),然后服务器端获得相应的点击日志,并根据点击日志进行分析和统计,从而改善检索结果。
现有技术存在以下缺点:
1、手工操作,消耗人力,且效率低下;
2、虽然可以借助开源框架的API(Application Programming Interface,应用程序编程接口)来点击,但是稳定性较差,而且速度比较慢;
3、目前手动方式不够灵活,不能根据需求,点击特定的页面元素,产生需要的点击日志。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一,特别是解决目前手动点击生成点击日志的方式效率低下、不够灵活的缺陷,以及通过开源库的API进行点击的稳定性差及速度慢的缺陷。
本发明实施例第一方面提出了一种点击日志生成方法,包括以下步骤:分析待测页面,以获得所述待测页面的统一资源定位符URL;解析所述待测页面所对应的URL以获得所述待测页面所对应的超文本标记语言HTML源码;在所述待测页面所对应的所述HTML源码中提取js函数调用,其中,所述js函数调用之中填充有所述待测页面中的待测页面元素的URL、题目和标签;以及在浏览器之中执行所述js函数调用以生成相应的点击日志,并将所述点击日志发送至服务器。
本发明实施例第二方面提出了一种点击日志生成装置,包括:分析模块,用于分析待测页面,以获得所述待测页面的URL;HTML源码获得模块,用于解析所述待测页面所对应的URL以获得所述待测页面所对应的HTML源码;提取模块,用于在所述待测页面所对应的所述HTML源码中提取所述待测页面元素对应的js函数调用,其中,所述js函数调用之中填充有所述待测页面中的待测页面元素的URL、题目和标签;点击日志生成模块,用于在浏览器之中执行所述js函数调用以生成相应的点击日志;以及发送模块,用于将所述点击日志发送至服务器。
在本发明的一个实施例中,所述提取模块提取所述待测页面中所有能产生点击日志的待测页面元素的js函数调用。
在本发明的另一个实施例中,所述提取模块提取所述待测页面中配置项path对应的页面节点内的所有待测页面元素的js函数调用。
在本发明的再一个实施例中,所述提取模块提取所述待测页面中配置项fm_type对应的类型的所述待测页面元素的js函数调用。
本发明实施例首先通过开源库中的函数实现浏览器打开待检测页面,并通过开源库函数获取待检测页面的HTML源码。然后,解析待检测页面的HTML源码,并在解析结果中匹配待测页面元素的特性,从而找出所有待测页面元素的HTML源码。最后,分别从待测页面元素的HTML源码中提取出js函数调用,并在浏览器端执行,即进行模拟点击,从而产生待测页面元素的点击日志。通过本发明实施例,每分钟可生成约600条以上的点击日志,因此大幅度地提高了测试速度。此外,在执行过程中无需人工干预,所以节约了人工成本。
另外,由于现有技术中仅能测试少量的检索词,而本发明实施例可批量地测试大数量的检索词,从而大幅度地提升了测试检索词的覆盖度。更为重要地,现有技术中仅能对搜索结果页面元素进行抽样点击以生成点击日志,而本发明实施例可对待测页面的所有待测页面元素进行模拟点击,或者仅针对某个页面节点内的所有待测页面元素进行模拟点击,或者,仅针对性地对某类型的待测页面元素进行模拟点击并生成点击日志,因此本发明实施例大幅提升了页面内可测元素的覆盖范围,并且在测试对象方面具有可控性。
综上所示,本发明实施例可灵活地进行配置,因此能够支持当前所有的待测页面元素以及未来新增的待测页面元素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110289117.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:视频播放次数统计方法
- 下一篇:一种氟维司群的新的制备方法