[发明专利]一种基于聚类的差分隐私轨迹数据保护方法在审
申请号: | 201910976396.6 | 申请日: | 2019-10-15 |
公开(公告)号: | CN110727959A | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 皮德常;赵晓东;袁水莲 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 噪音 类簇 轨迹位置 位置数据 聚类 攻击 隐私 聚类中心 受限 数据可用性 轨迹数据 技术应用 聚类分析 敏感信息 区域查询 数据添加 信息数据 隐私泄露 大影响 推理 查询 关联 | ||
本发明公开了一种基于聚类的差分隐私轨迹数据保护方法,包括:为抵御连续查询攻击对类簇中的轨迹位置计数添加拉普拉斯噪音;其次,对类簇中的轨迹位置数据添加半径受限的拉普拉斯噪音,避免了噪音过大影响聚类效果;根据噪音位置数据和噪音位置计数得到类簇的噪音聚类中心;最后,利用差分隐私技术抵御类簇中的非轨迹位置敏感信息攻击。本发明的优点是:将差分隐私技术应用到轨迹聚类分析中;针对每个类簇中的位置数据、聚类中心添加拉普拉斯噪音,避免攻击者通过相邻聚类区域查询得出用户具体的位置数据;添加到轨迹位置中的噪音的大小是受限的,提高了数据可用性;对其它可能导致隐私泄露的信息数据添加拉普拉斯噪音,抵御了相应的推理关联攻击。
技术领域
本发明涉及一种基于聚类的差分隐私轨迹数据保护方法,是针对轨迹数据在聚类分析中的隐私泄露问题的方法,属于工程应用与信息科学的交叉领域。
背景技术
随着位置感知设备的普及,人们享受到了便捷的位置服务,同时也使得越来越多的轨迹位置数据在用户未知情况下每日被移动对象数据库所收集。由于数据库系统的日益强大和数据存储的成本的不断降低,个人数据的收集已经不仅仅是政府部门和统计部门的工作,诸如金融部门、互联网公司、医疗机构等都持有大量的个人数据。随着大数据技术的快速发展,数据挖掘在一些研究和应用中取得了很大的进步。在数据挖掘中,聚类是较为有效的手段之一,并且现如今聚类分析方面的应用也越来越多,可用于统计数据分析、图像处理、模式识别、生物信息学等领域。
同样,存储在移动对象数据库中的时空数据,可以用来进行轨迹聚类相关的时空数据挖掘,例如挖掘热门的位置区域以进行商业分析;检测道路拥堵情况以进行交通规划;了解居民活动模式以进行城市规划。然而,这些轨迹数据的发布也会泄露用户的个人敏感信息,例如用户的生活习惯、宗教信仰、家庭地址以及个人的兴趣偏好等,这些信息在未经用户许可情况下可用作广告推荐和用户剖析,更可能被不法分子所获取从而进行非法活动,大量敏感位置信息的泄露将会给用户带来无法估量的损失和安全威胁。公民隐私保护日益得到全世界的重视,如何保护数据隐私,构建有效的隐私保护数据发布模型,已成为当前研究的热点。
目前隐私保护的方法的应用研究主要集中在关联规则挖掘和分类挖掘,基于聚类分析的隐私保护方法相对较少。从已有的隐私保护技术上来看:k-匿名及其扩展的保护模型技术已经被广泛应用。该方法是通过存储至少k条记录来隐藏一条数据记录从而达到隐私保护的目的。但是,该技术往往不对攻击者的数据背景做定义,所以在处理复杂的攻击模型的时候,随着攻击者掌握越来越多的背景知识,攻击的方式变得越来越复杂,如联合性攻击、一致性攻击等基于背景知识的复杂攻击,这些隐私保护模型往往难以应对。差分隐私保护模型是目前认为最可靠的一种模型,该模型无需知晓攻击者的背景信息即可抵御任何模型的攻击。目前,在聚类的基础上结合差分隐私的研究还不够成熟,研究较少。现有的差分隐私聚类分析方法,大多聚类结果的可用性对于噪声并不稳健。
以上算法普遍存在要么聚类效果不好,要么数据的可用性较差,要么难以抵御基于背景知识的复杂攻击。基于以上分析,本发明提出了一种基于聚类的差分隐私轨迹保护方法。该方法将差分隐私技术运用到轨迹聚类中,通过对每个类簇中的轨迹位置、聚类中心以及位置计数添加拉普拉斯噪音来抵御攻击。由于无法确定轨迹数据不同维度之间是否存在相关性,我们通过各维度单独添加噪音的结果和二维空间下添加噪音的结果的线性组合来表示最终的噪音结果。同时考虑到轨迹中可能包含其它导致隐私泄露的信息,为了保护用户的轨迹隐私,防止攻击者通过这些信息进行推理关联,本发明也对这些数据结果添加了噪音。
发明内容
发明目的:本发明的目的是提供一种适用于聚类分析的差分隐私轨迹数据保护方法。在轨迹的聚类分析中,存在着若干种不同的攻击方式,通过这些攻击方式可以获取用户的轨迹隐私,本发明针对轨迹聚类中的几种攻击方式,利用差分隐私技术给出了相应的抵御方式。除此以外,还利用马尔科夫链来提高数据的可用性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910976396.6/2.html,转载请声明来源钻瓜专利网。