[发明专利]一种基于空间序列数据分析的用户轨迹隐私保护方法有效
申请号: | 201610028542.9 | 申请日: | 2016-01-15 |
公开(公告)号: | CN105701418B | 公开(公告)日: | 2018-08-14 |
发明(设计)人: | 桂小林;冀亚丽;杨广知;张晨;张开元;李敬;代兆胜 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F17/30 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于空间序列数据分析的用户轨迹隐私保护方法,首先对每个移动用户的空间序列数据进行聚类分析,获得每个用户的兴趣点和兴趣区;然后,对指定区域内的全体用户的兴趣点和兴趣区按照时间进行迭代,得到不同时间范围内的用户公共兴趣区;最后,在每个公共兴趣区内,采用位置随机交换方法实现用户轨迹隐私的动态保护。本发明通过对轨迹数据进行时间维度和空间维度的分析处理,在隐私保护的同时确保统计特征、聚类特征不变,满足了空间大数据发布和共享时区域分析(区域对比分析、人口密度分析、交通状况分析等)的应用需求,达到了平衡隐私保护与数据可用性矛盾的目的。 | ||
搜索关键词: | 一种 基于 空间 序列 数据 分析 用户 轨迹 隐私 保护 方法 | ||
【主权项】:
1.一种基于空间序列数据分析的用户轨迹隐私保护方法,其特征在于,包括以下步骤:A.提取个人兴趣点:对每个移动用户的空间序列数据进行聚类分析;B.构建公共兴趣区:对全体用户的兴趣点按时间分区进行聚类分析;C.在公共兴趣区内交换位置:对同一个兴趣区内的用户位置进行随机交换;步骤A具体包括以下步骤:A1:对于每个移动用户一天内所有的采样位置,使用基于密度的聚类方法对其进行聚类,并根据聚类结果生成聚类索引;A2:根据指定的时间阈值和漂移点个数阈值,使用基于时间序列的方法对每个移动用户的聚类索引进行分析,修改不能形成兴趣区的采样点的聚类索引、漂移点的聚类索引,生成每个用户的个人兴趣区索引;A3:将个人兴趣区索引中数值相同的采样点按照指定的方式生成个人兴趣点;步骤A1具体包括以下步骤:设置位置矩阵MOS表示某一天所有用户的所有采样位置,其中行向量代表一个用户,列向量代表某一采样时刻;设采样时间间隔为t,t的计量单位为秒;用户总数为NOS;矩阵MOS中元素为mosi,j,其中i=1,2,…,nOS;j=1,2,…,mOS,行数nOS=NOS,列数mOS为:
设给定的时间阈值为Ts,给定的聚类半径为RSP,采用DBSCAN进行聚类时设置Eps=RSP;聚类区域中所包含的点数的最小值MinPts为:
根据DBSCAN聚类结果生成的聚类索引矩阵ICR;ICR的元素为icri,j,ICR大小与MOS相同;步骤A2具体包括以下步骤:根据指定的时间阈值和漂移点个数阈值,使用基于时间序列的方法对每个移动用户的聚类索引进行分析,修改不能形成兴趣区的采样点的聚类索引、漂移点的聚类索引,生成每个用户的个人兴趣区索引;对于需要修改的聚类索引,通过矩阵约简的过程发现并修改;矩阵约简的具体方法如下:构造以Ts为时间间隔的矩阵IDR和与IDR大小相同的矩阵TDR1和TDR2,矩阵IDR的行数与ICR的行数相同,即nDR=nCR=nOS=NOS,矩阵IDR的列数mDR为:
IDR中元素为idri,j,其中i=1,2,…,nDR,j=1,2,…,mDR,使得:
其中k是与j*Ts最接近的采样时刻;在形成IDR的过程中,对每一个j*Ts到(j+1)*Ts时间段内的Ts/t列采样数据,仅保留了2列,其中j=1,2,…,mDR‑1;引入与IDR相应大小的矩阵TDR1和TDR2来记录idri,j在j*Ts到(j+1)*Ts内的结束时刻和idri,j+1在j*Ts到(j+1)*Ts内的开始时刻;在形成TDR1和TDR2的过程中,发现漂移点和一部分不能构成兴趣区的采样点;在形成TDR1和TDR2后,通过计算tdr1i,j+1与tdr2i,j的差值,发现其他的不能构成兴趣区的采样点;对于漂移点,将其聚类索引值修改为邻近采样点的聚类索引值,对于不能构成兴趣区的采样点,将其聚类索引值修改为噪声点的索引值;修改聚类索引后生成的索引矩阵IIA表示对应用户的个人兴趣区索引;索引矩阵IIA的元素为iiai,j,大小与ICR相同;步骤A3具体包括以下步骤:索引矩阵IIA的每一行对应一个用户的个人兴趣区索引,个人兴趣区索引值相同的采样点构成了此用户的一个个人兴趣区;个人兴趣区中所有采样点的位置数据反映在二维坐标平面上可形成一个区域,个人兴趣点通过指定方式对区域中的采样点进行处理得到;根据个人兴趣区索引IIA将MOS中的采样点位置变成相应的个人兴趣点位置,即设置与矩阵MOS大小相同的矩阵MIP,MIP的行数nIP=nOS=NOS,列数mIP=mOS,MIP中元素为mipi,j,其中i=1,2,…,nOS,j=1,2,…,mOS,使得:
其中(x,y)i表示MOS中第i行的某个兴趣点位置,A(x,y)i表示此兴趣点对应的兴趣区,Pi表示第i行所有兴趣点位置的集合;步骤B具体包括以下步骤:B1:对指定时间范围内所有用户的个人兴趣点,使用基于密度的聚类方法对其进行聚类,根据聚类结果生成指定时间范围内每个采样时刻的公共兴趣区索引;B2:将指定时间范围内的公共兴趣区索引中数值相同的个人兴趣点按照指定的方式生成公共兴趣点;步骤B1具体包括以下步骤:设SIPi(tb,te)表示MIP中指定时间范围内第i行所有兴趣点的集合;其中i=1,2,…,nOS,指定时间范围为tb采样时刻至te采样时刻,SIPi(tb,te)中无重复元素;SPA(tb,te)表示所有SIPi的并集,即:SPA(tb,te)=∪SIPi(tb,te) (6)对SPA(tb,te)的nspa个元素采用DBSCAN进行聚类,设置Eps=RSP和MinPts=k,得到SPA(tb,te)中所有元素spau(tb,te)分别对应的聚类索引值ispau(tb,te);其中u=1,2,…,nspa;根据SPA(tb,te)的聚类索引,生成tb采样时刻至te采样时刻内每个采样时刻的公共兴趣区索引
即
的元素为ipa(tb,te)i,j其中i=1,2,…,nos,j=b,b+1,…,e‑1,e,使得:
步骤B2具体包括以下步骤:索引矩阵
中公共兴趣区索引值相同的个人兴趣点构成了此时间范围内的一个公共兴趣区。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610028542.9/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置