[发明专利]一种基于鼠标行为的用户分类方法有效
申请号: | 201310395555.6 | 申请日: | 2013-09-03 |
公开(公告)号: | CN103440328A | 公开(公告)日: | 2013-12-11 |
发明(设计)人: | 邓玉辉;邓伟鸿 | 申请(专利权)人: | 暨南大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F3/0484;G06F3/033 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 陈燕娴 |
地址: | 510632 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 鼠标 行为 用户 分类 方法 | ||
技术领域
本发明涉及数据分析的技术领域,特别涉及一种基于鼠标行为的用户分类方法。
背景技术
随着互联网技术的发展,互联网上的内容也随着越来越丰富,我们能获得越来越多的信息,网络已经成为现代人生活中不可或缺的一部分。但是,对于个人来说,我们每天能够用于上网的时间是有限的。所以,对于互联网服务的提供者,特别是移动互联网,如何吸引用户的注意力,为用户提供更好的服务,成为了互联网服务提供者的一个值得深入研究的课题。时下,用于研究用户行为信息主要有以下两种方式:
一、基于网络日志的用户喜好挖掘。
作者在题目确定之初就已经在中国知网等大型的论文数据库里面进行了长时间的文献搜索。结果发现,基本上所有针对于网络上的用户喜好的数据挖掘都是基于网络日志,即只记录了用户的访问日志,然后基于日志URL的数据进行内容级别的挖掘。
这种方法可以直接挖掘到用户在最近一段时间内关注的内容,进而能够比较精确的确定用户的喜好。但是每个网页的信息并不局限于短短的URL,所以这种方法并不能具体而准确地得知用户关注的是网页中的哪些内容。
二,服务端对于用户的一些基本的点击信息的统计
现在很多人也利用挖掘到的一些IP(独立IP数)、PV(访问量)、UV(独立访客)乃至于用户访问的深度、在网页停留的时间等数据进行用户行为的挖掘。即通过用户登陆一个网站后所做的一切有目的事情都记录下来,进而挖掘其本身内在的意义。
这种方法主要是用于服务端的统计,可以知道对于网站本身哪些方面比较吸引访问的用户,结合前一种基于网络日志的挖掘方法,可以很好地实现C/S模式上的挖掘互补。
但是,这些挖掘到的数据都是用户已经浏览的信息,对于用户是否对已经浏览过的信息来确定其依然对这方面的信息感兴趣本来就值得怀疑的。而且,这些方式并没有很好地研究用户在进入网站后的动作特征,并没有很好第体现用户的操作习惯。
利用鼠标操作计算机是人类与计算机进行沟通的一个重要行为。因此,对用户使用鼠标的行为进行研究,能为我们提供针对不同人群的习惯以及喜好提供更多的有效依据,并且可以更加迅速、实时、精准地定位正在浏览网页的用户特征。
另外,网络的虚拟世界已经成为了人类人与人之间沟通、获取信息的最重要途径之一。时下充斥着“宅男”、“宅女”等流行词语无不暗示着人们使用PC甚至手机接入互联网的已经成为了除了生活中最主要的一部分了。而且,在图形界面下,人类与计算机最直接迅速的沟通行为就是鼠标行为,使用鼠标就如同我们直接地使用双手去做事那样子。所以,研究用户的鼠标行为能够为网站提供更多有用的用户信息。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种在客户端收集数据并对用户进行分类的方法。
本发明的目的通过下述技术方案实现:
一种基于鼠标行为的用户分类方法,包括下述步骤:
S1、对电脑屏幕区域划分,对用户不同尺寸的屏幕、分辨率进行统一量化;
S2、建立鼠标热点区域模型,统计在规定时间间隔的鼠标坐标序列内,其落在每个已经划分好的区域的次数,然后根据鼠标在某个区域内出现的次数的多寡,来判断该区域的热点程度,同时通过比较不同类别用户每个区域热点程度的不同来进行分类;
S3、建立鼠标活跃度模型,用于评定每个划分好的区域内用户鼠标移动的活跃程度,鼠标的活跃程度是在一个时间段内这个区域内鼠标坐标分布的离散程度,离散程度越高,则说明这个区域的用户的鼠标动作越活跃,根据用户每个区域鼠标活跃度的异同特征,对用户进行分类。
优选的,通过使用Windows提供的API、Linux的shell脚本或者浏览器的Javascript脚本来读取用户屏幕的分辨率,并根据实际应用情况来进行区域的划分。
优选的,对于鼠标热点区域模型,在其实际投入运行之前,需要收集并利用用户的数据来对不同类别的人群进行数据分析,挖掘其在电脑屏幕或者网页内热点区域的异同,统计得出基于最大似然概率的分类先验概率;热点区域的判断方法为:分类别导入某一类别的用户的一定量基于时间序列的鼠标坐标数据,判断每个鼠标坐标所在区域,然后在其所在区域的热点频度上加一,当数据导入完之后,频率高的区域即为其热点区域,通过控制导入不同类别用户的数据集数据量,使得它们大小相等,从而进行不同区域的频率统计,把其频率归一化作为其分类的先验性概率。
优选的,把频率归一化作为鼠标行为用户分类的先验性概率的具体方法如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暨南大学,未经暨南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310395555.6/2.html,转载请声明来源钻瓜专利网。