[发明专利]一种融合隐私保护的轨迹数据标签聚类方法有效
| 申请号: | 202010048296.X | 申请日: | 2020-01-16 |
| 公开(公告)号: | CN111259444B | 公开(公告)日: | 2022-09-16 |
| 发明(设计)人: | 樊娜;崔雪莹;段宗涛;王路阳;王志凯 | 申请(专利权)人: | 长安大学 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 马贵香 |
| 地址: | 710064 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 融合 隐私 保护 轨迹 数据 标签 方法 | ||
本发明公开了一种融合隐私保护的轨迹数据标签聚类方法,将车辆轨迹数据挖掘与轨迹中兴趣点的隐私保护结合起来;在标签传播的过程中,对于存储的标签序列,首先将车辆身份识别号进行全局泛化处理,实现对单个车辆轨迹的匿名处理;对于精确到位置点的经纬度坐标列,结合车辆轨迹数据中的停留点数据,对兴趣点进行局部泛化处理,其他点采用全局泛化处理方法,继而实现对所有高频停留点的隐私保护,在聚类过程中,考虑了轨迹数据中的车辆身份标识号以及GPS坐标属性语义信息,将车辆轨迹数据挖掘与泛化处理结合起来,对车辆轨迹数据中的敏感信息进行隐匿处理,本方法能够有效保护车辆轨迹聚类过程中所涉及到的隐私信息。
技术领域
本发明涉及车辆轨迹数据挖掘及隐私保护领域,具体为一种融合隐私保护的轨迹数据标签聚类方法。
背景技术
随着车载无线传感设备的发展和普及,可以收集到的车辆轨迹数据信息也愈加完善。轨迹聚类方法是对轨迹数据进行分析、应用的关键技术之一。传统的轨迹聚类方法主要采用基于距离测量的方法,但存在聚类不精确、估算成本高、缺乏隐私保护机制等缺点。近年来提出的基于语义分析的轨迹聚类方法有效提高了聚类精度,但是在聚类的过程中,依然没有考虑隐私保护。因此如何在进行轨迹数据挖掘的同时保护隐私敏感数据不会泄露,成为亟需解决的问题。
发明内容
针对现有技术中存在的问题,本发明提供一种融合隐私保护的轨迹数据标签聚类方法,能够有效保护车辆轨迹聚类过程中所涉及到的隐私信息。
为达到上述目的,本发明采用如下技术方案:
一种融合隐私保护的轨迹数据标签聚类方法,包括以下步骤:
步骤1)、数据预处理:将从车载传感器获取到的最原始轨迹数据进行降维处理;
步骤2)、对偶图转换:根据降维处理后的最原始轨迹数据将道路网中两个交叉路口之间的道路段建模为一个节点,并将每两个节点之间的交叉路口建模为节点间的连线,从而将道路网转换为对偶图;
步骤3)、初始化所有节点的标签信息,使得每个节点拥有唯一的标签,并为每一个节点设置一个存储历史标签的序列,然后对初始化后的标签信息通过SLPA标签传播方法进行标签传播,完成标签聚类;
步骤4)、对存储历史标签的序列进行泛化处理;
步骤5)、去除低频标签:根据步骤3)标签序列中以及步骤4)泛化处理后的标签聚类结果,如果标签聚类结果中出现的频率低于预先设定的阈值,则删除该标签;否则直接输出最终聚类结果。
进一步的,将从车载传感器设备获取到的最原始轨迹数据中移除异常数据,同时从最原始轨迹数据集中提取GPS坐标属性作为轨迹的语义标签;然后将原始轨迹数据进行高斯投影,将原始轨迹中的经纬度坐标转化为大地坐标,从而完成对最原始轨迹数据的降维处理。
进一步的,通过高斯投影坐标转换工具将原始轨迹数据进行高斯投影。
进一步的,步骤2)中,随机选择一个节点,记做监听节点,并将该节点设置为当前节点,将其邻居节点记做传播节点;
当前节点的每一个传播节点随机选择概率正比于在当前节点存储序列中出现概率(Pi)的标签,并把该标签发送到监听节点;
其中,listi表示当前存储序列中选中标签出现的次数,∑listi表示当前标签序列中所有标签出现次数的总和,0Pi=1;
当前节点从传播节点传播的标签信息集中选择出现概率最大的标签添加到监听节点存储的标签列表中,并将出现概率最大的标签作为本次迭代中的新标签;
重复上述迭代过程使标签在不断的遍历过程中传播,直至收敛或遍历达到设定的次数,结束迭代。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长安大学,未经长安大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010048296.X/2.html,转载请声明来源钻瓜专利网。





