[发明专利]一种密度峰值聚类算法的差分隐私保护方法在审

专利信息
申请号: 201710680326.7 申请日: 2017-08-10
公开(公告)号: CN107451618A 公开(公告)日: 2017-12-08
发明(设计)人: 孟小峰;郭胜娜 申请(专利权)人: 中国人民大学
主分类号: G06K9/62 分类号: G06K9/62;G06F21/60
代理公司: 北京纪凯知识产权代理有限公司11245 代理人: 徐宁,孙楠
地址: 100872 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种密度峰值聚类算法的差分隐私保护方法,其步骤1)基于Voronoi图分割的方法对数据对象进行分组,并采用Map Reduce技术来并行计算,提高算法的效率;2)对数据集D中每一个点xi计算局部密度2.1)需要从分组聚簇Si复制四个点到Sj;2.2)往数据集中添加噪音;2.3)使得ρ'的计算满足ε‑差分隐私保护;3)对每一个点xi计算密度距离在计算值时,为解决因分组导致的计算错误,采用复制过滤模型来保证聚类隐私保护的正确性。并将数据集中添加噪音,其处理方法与步骤2.1)至2.2)相同,使δ”的计算满足ε‑差分隐私。本发明能解决大数据背景下的新型密度峰值聚类算法的隐私保护,保证聚类的正确性。
搜索关键词: 一种 密度 峰值 算法 隐私 保护 方法
【主权项】:
一种密度峰值聚类算法的差分隐私保护方法,其特征在于包括以下步骤:1)基于Voronoi图分割的方法对数据对象进行分组;2)对数据集D中每一个点xi计算局部密度2.1)需要从分组聚簇Si复制四个点到Sj;2.2)往数据集中添加噪音:ρ′=Σxjχ(dxixj-dc)+Lap(β)Lap(β)=exp(-|x|/β,β=GSρ/ϵ1)]]>式中,ρ'表示加入噪音后的局部密度值,表示点xi和点xj之间的距离,dc表示阈值,Lap(β)表示加入的噪音,β表示加入的噪音量,χ()表示是一个函数,如果l<0,则χ(l)=1;否则χ(l)=0,GSρ表示局部密度函数ρ的敏感度,ε1表示第一阶段隐私预算;2.3)如果dc满足如下不等式,则ρ'的计算满足ε‑差分隐私保护:3)对每一个点xi计算密度距离并将数据集中添加噪音,其处理方法与步骤2.1)至2.2)相同,使δ”的计算满足ε‑差分隐私。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710680326.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top