[发明专利]一种基于深度学习的轨迹数据去匿名方法有效
申请号: | 201910631703.7 | 申请日: | 2019-07-12 |
公开(公告)号: | CN110502919B | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 张蕊;向阳;谢鹏 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/29;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 轨迹 数据 匿名 方法 | ||
1.一种基于深度学习的轨迹数据去匿名方法,其特征在于,包括以下步骤:
步骤1:在预设的划分精度下,将轨迹数据空间划分为若干个网格形状的子空间;
步骤2:对于真实世界的轨迹数据集,将轨迹数据分为两组,一组是已知用户轨迹数据,另一组是匿名用户轨迹数据,将两组轨迹数据拆分成轨迹段,映射到网格数据中,从而得到所述轨迹数据对应的一组网格标识序列;
步骤3:将步骤2中得到的一组网格标识序列输入到改进的DenseNet模型中,已知用户轨迹数据作为训练集,匿名用户轨迹数据作为测试集;对训练集经过若干次迭代、训练,得到训练好的模型;
步骤4:将训练好的模型运用于匿名用户轨迹段数据,通过模型对轨迹的分类,将匿名数据与已知用户数据集中的数据对应,找到匿名用户轨迹数据对应的真实用户信息,从而达到轨迹数据去匿名效果。
2.根据权利要求1所述的基于深度学习的轨迹数据去匿名方法,其特征在于:步骤1中,网格形状的子空间大小设定为grid_width=16,grid_height=16。
3.根据权利要求1所述的基于深度学习的轨迹数据去匿名方法,其特征在于,步骤2的具体实现包括以下步骤:
步骤2.1:将轨迹数据用四元组表示为(mmsi,lat,lon,ti),其中mmsi表示移动目标、lon表示地理坐标经度、lat表示地理坐标维度、ti表示记录时间,作为网格数据映射的输入;
步骤2.2:将轨迹数据按不同用户拆分为若干个轨迹段,记录轨迹段中轨迹点的个数,取得每一个当前轨迹段最大纬度、最小纬度、最大经度和最小经度;
步骤2.3:利用记录的最大最小纬度按照以下公式将轨迹映射到网格数据中;
inter_lat=(max_lat-min_lat)/grid_width
inter_lon=(max_lon-min_lon)/grid_height
grid_lat=int((max_lat-float(lat))/inter_lat)
grid_lon=int((float(lon)-min_lon)/inter_lon)
其中,grid_width,grid_height表示网格形状的子空间大小,inter_lat,inter_lon分别表示当前轨迹段的经纬度映射精度,max_lat,min_lat,max_lon,min_lon分别表示当前轨迹段的最大纬度、最小纬度,最大经度和最小经度;float(lat)、float(lon)表示纬度、经度的浮点数,grid_lat、grid_lon表示网格纬度和网格经度。
4.根据权利要求3所述的基于深度学习的轨迹数据去匿名方法,其特征在于:步骤3中,所述改进的DenseNet模型,由多个Dense Block组成,并引入了注意力机制,block内部结构为BN-ReLU-Conv(1×1)-BN-ReLU-Conv(3×3);每个Dense Block的之间层为transitionlayers,由BN->Conv(1×1)->average Pooling(2×2)组成;通过堆叠Attention DenseModule,加强网络中特征的传播,同时也减少了网络的参数;
改进的DenseNet模型使用keras和tensorflow来搭建。
5.根据权利要求3或4任意一项所述的基于深度学习的轨迹数据去匿名方法,其特征在于:步骤4中,通过轨迹分类,将这些匿名轨迹与其对应的mmsi对应;mmsi相同的轨迹段即为同一用户的轨迹数据,即完成了对假名用户的去匿名化,获取其真实用户信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910631703.7/1.html,转载请声明来源钻瓜专利网。