[发明专利]一种密度峰值聚类算法的差分隐私保护方法在审

专利信息
申请号: 201710680326.7 申请日: 2017-08-10
公开(公告)号: CN107451618A 公开(公告)日: 2017-12-08
发明(设计)人: 孟小峰;郭胜娜 申请(专利权)人: 中国人民大学
主分类号: G06K9/62 分类号: G06K9/62;G06F21/60
代理公司: 北京纪凯知识产权代理有限公司11245 代理人: 徐宁,孙楠
地址: 100872 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 密度 峰值 算法 隐私 保护 方法
【说明书】:

技术领域

发明涉及一种差分隐私保护方法,特别是关于一种密度峰值聚类算法的差分隐私保护方法。

背景技术

随着差分隐私保护的技术出现,对于传统的聚类算法,出现了很多差分隐私保护的聚类方法。但是对于大数据下新型的聚类算法还没提出相应的隐私保护方法。隐私保护k-means聚类和隐私保护DBSCAN已经被研究。不同于差分隐私,他们不能够对会潜在泄露个人信息的结果提供保护。聚类的结果中可能包含新的实体或结点之间未知的关系,因此聚类可能揭示敏感信息。

到目前为止,研究最多的是对k-means聚类算法的隐私保护。从2003到2008 年,大多数的k-means算法研究采用安全多方计算,其中数据的分布类型包括垂直数据,水平数据和混合数据。上述工作采用的是Yao协议和同态加密技术。隐私代价是通过计算和通信成本来衡量的,对比于同态加密技术的隐私代价,Yao 协议代价将更大,而且同态加密技术的加密成本也是不容忽视的。传统的基于分割的聚类算法(最常见的为k-means算法)不能够发现非球面形状的聚簇,基于密度的聚类方法可以识别,经典的基于密度的聚类算法为DBSCAN。对此聚类算法的一些隐私保护工作包括Kunar et al.(针对水平和垂直分布的数据),以及 Jinfeiet.al(数据分布特征可以是任意分布的),他们都是基于Pailler的加法同态加密技术的乘法协议。但是,这些安全函数保护协议都忽略了一个问题就是没有函数使用来保护隐私的,他们并不提供保护个人敏感信息不被泄露。自从差分隐私被提出并被数据库领域广泛接受后,隐私保护要求已经实现了从句法模型更严格的差分隐私模型。

当然,其中去多工作是针对k-means算法。例如,McSherry构建了PINQ系统,实现了差分隐私保护k-means聚类算法。Nissim et al.提出了抽样与聚合框架,并应用到了GUPT系统中,也实现了对k-means算法进行了隐私保护。Zhang et al. 提出了基于遗传算法的差分隐私模型拟合,也应用到了k-means算法。

在数据类型多样性的背景下,Alex Rodriguez和Alessandro Laio提出了快速搜索和发现密度峰值的聚类算法(DPC算法)。此聚类算法能够聚出任意形状和任意维度的数据集,它可以很好的应用于生物信息学、文献计量学、模式识别。据我们所知,目前关于此聚类算法还没有隐私保护的工作。

发明内容

针对上述问题,本发明的目的是提供一种密度峰值聚类算法的差分隐私保护方法,该方法能解决大数据背景下的新型密度峰值聚类算法的隐私保护,保证聚类的正确性。

为实现上述目的,本发明采取以下技术方案:一种密度峰值聚类算法的差分隐私保护方法,其特征在于包括以下步骤:1)基于Voronoi图分割的方法对数据对象进行分组;2)对数据集D中每一个点xi计算局部密度2.1)需要从分组聚簇Si复制四个点到Sj;2.2)往数据集中添加噪音:

式中,ρ'表示加入噪音后的局部密度值,表示点xi和点xj之间的距离,dc表示阈值,Lap(β)表示加入的噪音,β表示加入的噪音量,χ()表示是一个函数,如果l<0,则χ(l)=1;否则χ(l)=0,GSρ表示局部密度函数ρ的敏感度,ε1表示第一阶段隐私预算;2.3)如果dc满足如下不等式,则ρ'的计算满足ε-差分隐私保护:

3)对每一个点xi计算密度距离并将数据集中添加噪音,其处理方法与步骤2.1)至2.2)相同,使δ”的计算满足ε-差分隐私。

进一步,所述步骤1)中,假设数据对象为数据集D,对于数据集D,挑选M 个点作为初始中心点集;然后根据垂直线,将数据集D分割成M个相互不相交的分组,数据集D中的每一个点被分配到最近的初始中心点所在的分组中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710680326.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top