[发明专利]一种密度峰值聚类算法的差分隐私保护方法在审
申请号: | 201710680326.7 | 申请日: | 2017-08-10 |
公开(公告)号: | CN107451618A | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 孟小峰;郭胜娜 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F21/60 |
代理公司: | 北京纪凯知识产权代理有限公司11245 | 代理人: | 徐宁,孙楠 |
地址: | 100872 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种密度峰值聚类算法的差分隐私保护方法,其步骤1)基于Voronoi图分割的方法对数据对象进行分组,并采用Map Reduce技术来并行计算,提高算法的效率;2)对数据集D中每一个点xi计算局部密度2.1)需要从分组聚簇Si复制四个点到Sj;2.2)往数据集中添加噪音;2.3)使得ρ'的计算满足ε‑差分隐私保护;3)对每一个点xi计算密度距离在计算值时,为解决因分组导致的计算错误,采用复制过滤模型来保证聚类隐私保护的正确性。并将数据集中添加噪音,其处理方法与步骤2.1)至2.2)相同,使δ”的计算满足ε‑差分隐私。本发明能解决大数据背景下的新型密度峰值聚类算法的隐私保护,保证聚类的正确性。 | ||
搜索关键词: | 一种 密度 峰值 算法 隐私 保护 方法 | ||
【主权项】:
一种密度峰值聚类算法的差分隐私保护方法,其特征在于包括以下步骤:1)基于Voronoi图分割的方法对数据对象进行分组;2)对数据集D中每一个点xi计算局部密度2.1)需要从分组聚簇Si复制四个点到Sj;2.2)往数据集中添加噪音:ρ′=Σxjχ(dxixj-dc)+Lap(β)Lap(β)=exp(-|x|/β,β=GSρ/ϵ1)]]>式中,ρ'表示加入噪音后的局部密度值,表示点xi和点xj之间的距离,dc表示阈值,Lap(β)表示加入的噪音,β表示加入的噪音量,χ()表示是一个函数,如果l<0,则χ(l)=1;否则χ(l)=0,GSρ表示局部密度函数ρ的敏感度,ε1表示第一阶段隐私预算;2.3)如果dc满足如下不等式,则ρ'的计算满足ε‑差分隐私保护:3)对每一个点xi计算密度距离并将数据集中添加噪音,其处理方法与步骤2.1)至2.2)相同,使δ”的计算满足ε‑差分隐私。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710680326.7/,转载请声明来源钻瓜专利网。
- 上一篇:便于深腔结构焊接的点焊装置
- 下一篇:一种自动送料焊接机