[发明专利]记录网络用户行为数据的方法及其装置、计算机可读介质在审
申请号: | 201710285002.3 | 申请日: | 2017-04-26 |
公开(公告)号: | CN107122457A | 公开(公告)日: | 2017-09-01 |
发明(设计)人: | 陈金添 | 申请(专利权)人: | 努比亚技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/08 |
代理公司: | 广东广和律师事务所44298 | 代理人: | 章小燕 |
地址: | 518000 广东省深圳市南山区高新区北环大道9018*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 记录 网络 用户 行为 数据 方法 及其 装置 计算机 可读 介质 | ||
技术领域
本发明涉及网络通信技术领域,尤其涉及一种记录网络用户行为数据的方法及其装置、计算机可读介质。
背景技术
随着网络技术的迅速发展,各种网站或网络应用也如雨后春笋般涌现。在网络业务领域,记录网络(web)用户的操作行为,并对这些数据进行分析,可以让企业更加详细、清楚地了解用户的行为习惯,从而找出网站、推广渠道等企业营销环境存在的问题,有助于企业发掘页面转化率,让企业的营销更加精准、有效,提高业务转化率,从而提升企业的广告收益。为了更好地掌握和分析网络(web)用户对网站以及网站中的网页访问的情况,需要执行网站分析(Web Analytics)。网站分析是指通过分析网络(web)用户对网页访问的行为来提供一系列分析结果,利用所提供的分析结果可以方便并直观地了解网络(web)用户对网页访问的趋势。具体地,分析结果可能包括提供了访问者在网站内部的网页访问顺序的点击路径信息,利用此种信息网站技术人员可以更好地组织并调整网站内部的网页结构和内容安排。
网络(web)用户行为分析一般包括数据采集和数据分析:
其中,数据采集就是获取Web用户行为数据的过程,对于网站来说,自动获取用户行为数据最常用的方法就是基于服务器日志的方法(Server log),就是通过web服务器所产生的日志文件来获取有用的数据,通常情况下日志文件中存在着大量与用户行为分析无关的冗余数据,如何从这些海量的数据中提炼出与用户行为分析是非常关键的一步,因此需要对日志文件进行预处理,然后进行分析,目前最重要的技术就是web日志的挖掘。但是,很多关于用户行为分析有价值的数据难以从日志文件中获取,因此,为了进一步获取关于用户行为有价值的数据,逐渐产生了从客户端直接获取用户与网站之间交互情况的行为数据的方法,主要包括基于浏览器的方法、基于网站的方法以及基于代理的方法,其中,基于浏览器的方法是由用户使用所开发的客户端程序去浏览网站,通常情况下是对已有的浏览器进行定制,例如IE,Navigator,也可以是其他的浏览器,然后利用开发的客户端程序获得用户与网站交互的行为数据并把数据传回到服务器端。基于网站的方法是通过被测试的服务器端安装组件,这一组件的功能就是对用户要访问的网页的Html代码中自动插入事件处理脚本程序,而且插入的代码是JavaScript脚本,因此,对于当前主流的浏览器均能够获得支持。基于代理的方法是在测试用户的客户端和被测试的服务器之间架设一代理服务器,代理服务器用来完成被测试服务器的用户行为数据的收集工作。通过代理的方法可以对多个不同的用户浏览不同的网站进行数据收集。
所谓数据分析实际上是一个从海量数据获得有价值的信息的数据挖掘过程,通过对采集到的流量数据的过滤、预处理、综合分析处理等程序,从中获取有价值的分析结果,并以准确直观的方式表示出来。
然而,在记录用户操作行为过程,也即是数据采集过程中需要面临两个问题:其一,由于记录用户的操作行为必然会耗费用户对页面操作的响应时间,从而影响用户体验;其二,在大量web用户同时在线进行操作时,记录用户行为直接写非内存型数据库,可能会对非内存型数据库的服务器造成极大的压力。
发明内容
本发明的主要目的在于提出一种记录网络用户行为数据的方法及其装置、计算机可读介质,旨在解决大量网络(web)用户同时在线操作时,对服务器造成极大负荷的问题。
为实现上述目的,本发明提供的一种记录网络(web)用户行为数据的方法,该方法包括以下步骤:
获取网络(web)用户行为数据,将所述网络(web)用户行为数据写入本地缓存的阻塞式队列;
通过至少一个线程异步操作将所述阻塞式队列中的所述网络(web)用户行为数据进行处理并持久化到非内存型数据库。
其中,网络(web)用户行为数据至少包括以下信息类型:
访问网站的主体,主要是指用户的IP地址等信息;
访问网站的路径,主要是用户通过哪一种方式获得网站的链接;
用户网页停留时间,用户查询了网站的哪一些网页,在每一个网页中停留的时间;
用户是否达成浏览目的,例如用户进入购物网站,是否最终完成交易;或者用户进入文件查询网站,是否最终找到并获取用户所需要的文件;
用户的请求信息,例如进入购物网站时,用户查询了哪一类型的商品,或者在浏览器界面查询了哪一些信息;
用户请求的日期和时间,特别是用户请求的频率;
用户请求的结果,如成功、失败还是网站服务器发送错误、
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于努比亚技术有限公司,未经努比亚技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710285002.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:展示视频搜索结果的方法和装置
- 下一篇:一种基于共享语料库主动发起会话的方法