[发明专利]一种采用Wasserstein距离的差分隐私贪心分组方法有效
申请号: | 202011343298.8 | 申请日: | 2020-11-26 |
公开(公告)号: | CN112307514B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 杨悦;牛艺霖 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 采用 wasserstein 距离 隐私 贪心 分组 方法 | ||
本发明公开了一种采用Wasserstein距离的差分隐私贪心分组方法,步骤1:读取第i时间点数据集Dsubgt;i/subgt;;步骤2:将Dsubgt;i/subgt;与数据集Dsubgt;i‑1/subgt;进行Wasserstein距离相似度计算;步骤3:当Wasserstein距离大于给定阈值T,则直接发布;否则,执行步骤4;步骤4:判断上一次数据发布是否为直接发布,如果是直接发布,则先对当前时间点上的数据进行贪心分组,再进行发布;否则执行步骤5;步骤5:则用上一个时间点上发布的噪声数据来代替本次发布。本发明利用Wasserstein距离来计算数据之间的差异,并在数据发布过程中利用贪心分组的方式降低全局敏感度,降低数据发布误差,提高数据发布效用。
技术领域
本发明涉及一种差分隐私贪心分组方法,特别是一种采用Wasserstein距离的差分隐私贪心分组方法,属于计算机技术领域中的差分隐私数据发布技术。
背景技术
随着网络信息技术应用的不断发展和进步,各种信息系统储存并积聚了各类丰富的数据。但是,数据集里包括了大量的个人隐私,在数据发布的过程中如果不进行一定的保护措施,随着数据集的发布和共享,可能会造成敏感信息的泄露。直方图通过采用分桶的数据表示形式,实现了范围计数查询和其他线性查询,能够直观地表示数据的发布信息。并且,差分隐私直方图发布方法与其他数据发布方法相比,直方图查询敏感度的计算与数据集的大小和数据集维度都无关。因此对直方图数据发布的研究有助于保护数据的隐私保护,同时提高发布数据的可用性。
动态数据的大规模性要求应用较好的噪声添加机制,否则将累加较大的误差使保护后的数据无可用性。针对这种情况,已有的面向动态数据发布的研究方法基于滑动窗口模型处理更新的数据,并采用距离测度的方法衡量相邻两个时间点的数据相似性,以此来动态地分配隐私预算。目前采用的距离测度方法有L1距离、KL散度、JS散度等,L1距离虽然计算比较简单,但是对衡量数据的相似度的敏感性较差;KL散度和JS散度则是突变的,要么最大要么最小;当两个概率分布没有重叠时,KL散度无意义,JS散度为常量。
发明内容
针对上述现有技术,本发明要解决的技术问题是提供一种在保证数据隐私保护的同时数据可用性高、数据发布误差低的采用Wasserstein距离的差分隐私贪心分组方法,实现动态调节对隐私预算的分配,减少算法的总误差,在保证发布数据隐私的同时,提高发布数据的可用性。
为解决上述技术问题,本发明的一种采用Wasserstein距离的差分隐私贪心分组方法,包括以下步骤:
步骤1:读取第i时间点接收的数据集Di;
步骤2:将Di与上一个时间点发布的数据集Di-1进行Wasserstein距离相似度计算;
步骤3:当Wasserstein距离大于给定阈值T,则直接发布,即对当前时间点的数据集添加拉普拉斯噪声发布;否则,执行步骤4;
步骤4:判断上一次数据发布是否为直接发布,如果是直接发布,则先对当前时间点上的数据进行贪心分组,再进行发布;否则执行步骤5;
步骤5:则用上一个时间点上发布的噪声数据来代替本次发布。
本发明还包括:
步骤2将Di与上一个时间点发布的数据集Di-1进行Wasserstein距离相似度计算具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011343298.8/2.html,转载请声明来源钻瓜专利网。
- 一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法
- 一种基于Wasserstein GAN的光伏阵列故障诊断方法
- 基于Wasserstein距离的卷积神经网络对抗迁移学习方法及其应用
- 一种基于深度学习和Wasserstein距离度量的指静脉识别方法
- 一种基于Wasserstein距离的深度对抗迁移网络的故障诊断方法
- 一种基于Sliced-Wasserstein距离的深度自编码进行图像降维并嵌入聚类的方法
- 基于信号分布Wasserstein距离度量的Wi-Fi室内定位方法
- 一种采用Wasserstein距离的差分隐私贪心分组方法
- 基于Wasserstein生成对抗网络模型的高能图像合成方法、装置
- 一种基于Wasserstein距离的物体包络体多视图重建与优化方法