[发明专利]一种密度峰值聚类算法的差分隐私保护方法在审
申请号: | 201710680326.7 | 申请日: | 2017-08-10 |
公开(公告)号: | CN107451618A | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 孟小峰;郭胜娜 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F21/60 |
代理公司: | 北京纪凯知识产权代理有限公司11245 | 代理人: | 徐宁,孙楠 |
地址: | 100872 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 密度 峰值 算法 隐私 保护 方法 | ||
技术领域
本发明涉及一种差分隐私保护方法,特别是关于一种密度峰值聚类算法的差分隐私保护方法。
背景技术
随着差分隐私保护的技术出现,对于传统的聚类算法,出现了很多差分隐私保护的聚类方法。但是对于大数据下新型的聚类算法还没提出相应的隐私保护方法。隐私保护k-means聚类和隐私保护DBSCAN已经被研究。不同于差分隐私,他们不能够对会潜在泄露个人信息的结果提供保护。聚类的结果中可能包含新的实体或结点之间未知的关系,因此聚类可能揭示敏感信息。
到目前为止,研究最多的是对k-means聚类算法的隐私保护。从2003到2008 年,大多数的k-means算法研究采用安全多方计算,其中数据的分布类型包括垂直数据,水平数据和混合数据。上述工作采用的是Yao协议和同态加密技术。隐私代价是通过计算和通信成本来衡量的,对比于同态加密技术的隐私代价,Yao 协议代价将更大,而且同态加密技术的加密成本也是不容忽视的。传统的基于分割的聚类算法(最常见的为k-means算法)不能够发现非球面形状的聚簇,基于密度的聚类方法可以识别,经典的基于密度的聚类算法为DBSCAN。对此聚类算法的一些隐私保护工作包括Kunar et al.(针对水平和垂直分布的数据),以及 Jinfeiet.al(数据分布特征可以是任意分布的),他们都是基于Pailler的加法同态加密技术的乘法协议。但是,这些安全函数保护协议都忽略了一个问题就是没有函数使用来保护隐私的,他们并不提供保护个人敏感信息不被泄露。自从差分隐私被提出并被数据库领域广泛接受后,隐私保护要求已经实现了从句法模型更严格的差分隐私模型。
当然,其中去多工作是针对k-means算法。例如,McSherry构建了PINQ系统,实现了差分隐私保护k-means聚类算法。Nissim et al.提出了抽样与聚合框架,并应用到了GUPT系统中,也实现了对k-means算法进行了隐私保护。Zhang et al. 提出了基于遗传算法的差分隐私模型拟合,也应用到了k-means算法。
在数据类型多样性的背景下,Alex Rodriguez和Alessandro Laio提出了快速搜索和发现密度峰值的聚类算法(DPC算法)。此聚类算法能够聚出任意形状和任意维度的数据集,它可以很好的应用于生物信息学、文献计量学、模式识别。据我们所知,目前关于此聚类算法还没有隐私保护的工作。
发明内容
针对上述问题,本发明的目的是提供一种密度峰值聚类算法的差分隐私保护方法,该方法能解决大数据背景下的新型密度峰值聚类算法的隐私保护,保证聚类的正确性。
为实现上述目的,本发明采取以下技术方案:一种密度峰值聚类算法的差分隐私保护方法,其特征在于包括以下步骤:1)基于Voronoi图分割的方法对数据对象进行分组;2)对数据集D中每一个点xi计算局部密度2.1)需要从分组聚簇Si复制四个点到Sj;2.2)往数据集中添加噪音:
式中,ρ'表示加入噪音后的局部密度值,表示点xi和点xj之间的距离,dc表示阈值,Lap(β)表示加入的噪音,β表示加入的噪音量,χ()表示是一个函数,如果l<0,则χ(l)=1;否则χ(l)=0,GSρ表示局部密度函数ρ的敏感度,ε1表示第一阶段隐私预算;2.3)如果dc满足如下不等式,则ρ'的计算满足ε-差分隐私保护:
3)对每一个点xi计算密度距离并将数据集中添加噪音,其处理方法与步骤2.1)至2.2)相同,使δ”的计算满足ε-差分隐私。
进一步,所述步骤1)中,假设数据对象为数据集D,对于数据集D,挑选M 个点作为初始中心点集;然后根据垂直线,将数据集D分割成M个相互不相交的分组,数据集D中的每一个点被分配到最近的初始中心点所在的分组中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710680326.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:便于深腔结构焊接的点焊装置
- 下一篇:一种自动送料焊接机