[发明专利]基于位置社交网络的用户轨迹相似性挖掘方法无效

专利信息
申请号: 201210390018.8 申请日: 2012-10-16
公开(公告)号: CN102880719A 公开(公告)日: 2013-01-16
发明(设计)人: 李智;张莹;秦旭 申请(专利权)人: 四川大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 610064 四川*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 位置 社交 网络 用户 轨迹 相似性 挖掘 方法
【权利要求书】:

1.一种基于位置社交网络的用户轨迹相似性挖掘方法,其特征在于:该方法从用户历史签到的地理位置信息上研究用户的轨迹相似性,提出一种用户相似性度量模型,即基于自适应密度聚类的用户轨迹相似性双重加权模型(Adaptive-Density-Clustering-Based User Trajectory Similarity Double Weighted Model, ADCBUTSDWM);

该方法首先针对位置社交网络的签到点,提出了基于聚类区域半径的自适应密度聚类算法(Clustering-Area-Radius-Based Adaptive Density Clustering Algorithm, CARBADCA),该基于聚类区域半径的自适应密度聚类算法首先对用户签到点进行自适应聚类操作,得到用户访问的自适应分层位置区域;在此基础之上,提出用户轨迹相似性双重加权模型(User Trajectory Similarity Double Weighted Model, UTSDWM),首先利用向量空间模型分别计算用户在不同分层位置区域下的加权相似性,再通过加权各层次上的相似性以得到用户行为轨迹上的总体相似性。

2.根据权利要求1所述的基于位置社交网络的用户轨迹相似性挖掘方法,其特征在于:所述的基于聚类区域半径的自适应密度聚类算法(CARBADCA)描述如下:

输入: 包含n个对象的数据库,初始聚类半径ε,邻域内最少数目MinPts,最终聚类区域半径限定值r; 

输出:所有生成的多个层次的分簇。 

阶段1:

  (1)Repeat 

  (2)从输入数据库中抽出一个未处理的签到点; 

  (3)标记为已处理;

(4)IF抽出的点是核心点,THEN找出所有从该点密度可达的对象,形成一个聚类区域i; 

  (5)ELSE抽出的点是边缘点(非核心对象),跳出本次循环,寻找下一个点; 

  (6)UNTIL所有的点都被处理;

 阶段2:

    (1)Repeat

(2)对于任一聚类区域i;

(3)IF聚类区域半径R大于r,根据公式(1)和(2)自适应调整聚类半径ε=ε’和MinPts=Minpts’,数据库对象n为本聚类区域i内签到点,Repeat阶段1;

(4)ELSE 子聚类区域等于父聚类区域,跳出本次循环;

(5)Recursive(2);

(6)UNTIL所有的聚类区域半径都<=r。

其中自适应因子的计算公式如下:

                       

                   。 

3.根据权利要求1所述的基于位置社交网络的用户轨迹相似性挖掘方法,其特征在于:所述的用户轨迹相似性双重加权模型(UTSDWM)描述如下:

(1)我们通过基于聚类区域半径的自适应密度聚类算法(CARBADCA),将签到点划分成了若干层次的聚类区域。下面我们就在每层聚类区域中,建立基于向量空间模型(VSM)的用户访问位置分层数据矩阵,如下面公式所示:

           

这是一个m*n阶的矩阵,其中m代表用户数,n代表签到区域数,表示第i个用户对第j个聚类区域的访问次数, g为划分聚类层次后的第g层。

如上面公式中,将某位用户i在某一层所签到的聚类区域记为向量  = [,,…,],n代表的是本层中所有聚类区域的总数,当用户i没有对签到区域k的访问记录时,这里记

                                                      

将不同的签到区域c的相似度权重定义如下:

                      

        其中,是签到区域c内的总签到次数,n为当前层总签到区域数。

用户i和j的在某层的相似性通过相关系数法,即下面公式来计算:

 

其中,表示i和j共同的签到区域的合集,表示用户i访问签到区域c的次数,表示用户j访问签到区域c的次数,,表示用户i和j对签到区域的平均签到次数。

(2)由(1)我们可以顺利得到用户i和j的分层相似度,其中g为相对应的层次,则该两个用户总的相似度通过如下加权得到:

               

其中,t为总层次数, 为该层对应的权值,且层次越低对应的权值越高,的计算公式如下:

                  。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210390018.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top