[发明专利]一种基于R-邻域关系与差分隐私的四分树隐私保护方法在审
申请号: | 202111006902.2 | 申请日: | 2021-08-30 |
公开(公告)号: | CN113704788A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 邹云峰;许道强;江明;单超;朱峰 | 申请(专利权)人: | 国网江苏省电力有限公司营销服务中心;国网江苏省电力有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/62;G06F21/64 |
代理公司: | 北京智绘未来专利代理事务所(普通合伙) 11689 | 代理人: | 张红莲;王萍 |
地址: | 210019 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 邻域 关系 隐私 四分树 保护 方法 | ||
本发明针对兼顾数据隐私的数值型关系数据表共享发布场景,公开了一种基于R‑邻域关系与差分隐私的四分树隐私保护方法,包括以下步骤:对给定关系数据集D,根据数据集分布和给定四分树期望深度h计算邻域半径R,将后续构建四分树的深度限制在[h‑1,h+1]范围内,构建基于R‑邻域关系的四分树,按四分树结构对树结点内数据记录添加差分隐私噪声后,将加噪后的数据表提交给不可信的数据分析方。本发明利用基于R‑邻域关系的差分隐私四分树构建方法,在保护个体数据隐私的同时,实现数据表聚类可用性的有效维持。
技术领域
本发明属于一种数据隐私保护技术领域,具体涉及的是一种面向数值型关系数据的基于R-邻域关系构建四分树的差分隐私数据发布方法。
背景技术
近年来,云计算、物联网等新型信息技术的发展,在为企业带来了海量具有极大挖掘价值的数据的同时,也向其数据隐私保护能力提出了挑战。在此背景下,如何在兼顾企业数据隐私安全和数据挖掘可用性,成为一个重要的研究课题。当前,维持聚类可用性相关的研究方法多采用具有高效、灵活的优点的基于数据失真的技术。但基于数据失真隐私保护方法通常不能抵御具有任何背景知识的攻击者,为此,Dwork等人提出了严格隐私保护模型——差分隐私模型,该模型通过对原始数据进行随机扰动,使得具有任何背景的攻击者都不能分辨某条数据记录是否在发布数据中。而后续的差分隐私四分树方法使用可用于划分平面空间的四分树结构对空间进行自适应划分减少噪声叠加。
现有技术文件1(CN110213763A)公开了一种面向位置密度分布攻击的隐私保护方法,针对区域隐私的位置密度分布攻击问题,提出一项隐私保护方案。本发明使用边缘服务器划分服务区域,并对各区域内的服务请求计数。接着,检测各子区域预设值之差及与其邻域的范围等级差,确定异常状态。最后,通过改进的差分隐私方法计算噪声添加的数量并向异常区域添加噪声,降低隐私保护预算,控制噪声成本,减少因背景知识对区域隐私造成的攻击,直至异常全部消失。现有技术文件1的不足之处在于,首先,该方法仅针对二维平面数据,对多维(属性)数据集并不适用;其次,该方法仅考虑对数据的单纯隐私保护,没有考虑到数据记录之间的邻域关系与数据集的整体分布规律,不能维持多维数据的聚类可用性。
现有的基于四分树的差分隐私保护方法应用于多维数据集时,存在两个问题:第一,这些方法有的仅针对二维平面数据,有的只考虑多维数据中区间数据的频率以构建直方图,没有考虑到数据记录之间的邻域关系与数据集合的整体分布规律,对维持多维数据的聚类可用性并不十分适配。第二,已有的差分隐私四分树方法在构建四分树时要么不控制四分树的深度,要么仅在递归过程中设置一个最大深度h以限制其层数,前者不能保证四分树的层数在性能最佳范围内,后者会导致数据记录在最后一层不分数量地“沉底”,使四分树结构不平衡,从而性能下降。
在差分隐私保护方法领域,使用隐私预算ε用来衡量隐私保护的强度,ε值越小,随机算法的隐私保护程度越高。
发明内容
为解决现有技术中存在的不足,本发明的目的在于,提供一种在保护数据敏感信息的同时维持数据聚类可用性的数值型数据隐私保护方法。
本发明采用如下的技术方案。一种基于R-邻域关系与差分隐私的四分树隐私保护方法,包括以下步骤:
步骤1,获取数值型关系原数据集D,计算原数据集D中任意两条数据记录之间的距离,并设置四分树深度约束值h和隐私预算ε;
步骤2,以步骤1的计算结果和设置的值,计算原数据集D中每条数据记录k邻域半径,选择最小的k邻域半径,作为后续构建四分树所使用的邻域半径R的值;
步骤3,以步骤1的计算结果和步骤2获得邻域半径R的值,构造原数据集D中每条数据记录的R-邻域,计算R-邻域密度、数据记录间R-邻域相似度、数据记录间R-邻域近聚度;
步骤4,按照步骤3获得的原数据集D中每条数据记录的R-邻域密度大小,对数据记录进行排序,计算分裂阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江苏省电力有限公司营销服务中心;国网江苏省电力有限公司,未经国网江苏省电力有限公司营销服务中心;国网江苏省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111006902.2/2.html,转载请声明来源钻瓜专利网。