[发明专利]基于一致性特征的非交互式差分隐私发布模型的优化方法有效
申请号: | 201510862311.3 | 申请日: | 2015-11-30 |
公开(公告)号: | CN105512247B | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 钱磊;宋涛;姚建国;梁阿磊;马汝辉;管海兵 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 上海新天专利代理有限公司 31213 | 代理人: | 张宁展 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于一致性特征的非交互式差分隐私发布模型的优化方法,其先为数据集的每个属性建立体现匿名层次的抽象树结构,作为划分原始数据集的依据;所有抽象树的根节点集合组成初始化的划分区间,把原始数据集归入其中,然后自顶向下依次不重复地选取一个属性作为划分依据,按照这个属性的抽象树结构产生下一层区间集,并划分数据集,依次类推直到事先定义的算法迭代次数,最终生成一棵构造树,并在叶节点处加拉普拉斯噪音;接着利用节点间的一致性特性,运行噪音优化算法f,使得在满足差分隐私保护的前提下,用父节点做应答的方式替代子节点组合的计算模式,大幅度减轻发布数据集对于范围查询类应用的噪音叠加问题。本发明有效的地缓解了范围计数类查询中的噪音叠加问题,并且符合差分隐私保护的定义,减少了隐私保护的代价,有效提高了发布数据在后续应用中的可用性。 | ||
搜索关键词: | 基于 一致性 特征 交互式 隐私 发布 模型 优化 方法 | ||
【主权项】:
1.基于一致性特征的非交互式差分隐私发布模型的优化方法,其特征在于:基于匿名化的数据保护算法,先为数据集的每个属性建立体现匿名层次的抽象树结构,由所有抽象树的根节点集合组成初始化的划分区间,把原始数据集归入其中,然后自顶向下依次不重复地选取一个属性作为划分依据,按照这个属性的抽象树结构产生下一层区间集,并划分数据集,依次类推直到事先定义的算法迭代次数,最终生成一棵构造树,并在叶节点处加拉普拉斯噪音;接着自底向上,根据一致性特性,把叶节点上的噪音散布到构造树的所有节点上,根据叶节点上的条目计数值发布新数据集,直接供用户使用;具体包括以下步骤:步骤1、为每个属性定义具有匿名层级关系的抽象树结构,每个父节点概括了其子节点集,并且定义划分迭代次数上限;步骤2、选取所有属性的抽象树的根节点集合作为构造树的根节点,所有原数据项都包含在这个节点中;从根节点开始,自顶向下地建树,每次迭代不重复地选取一个属性作为划分依据,按照这个属性的抽象树结构产生对应的子区间作为下层的子节点集,同时划分原数据项到相应的区间上;依次类推构建下层新节点并划分归纳原数据项,直到达到迭代次数,得到构造树,其每个叶节点是同一类匿名结果的数据项集合;步骤3、用满足差分隐私的拉普拉斯机制对构造树的叶节点的数据项条目计数加噪,运行不影响差分隐私的调整算法f,自底向上对落在叶节点的噪音进行调整,使其散布在所有节点上;步骤4、在调整算法f中,基于父子节点对之间的一致性特性,先通过后序遍历再通过先序遍历构造树对噪音进行调整;步骤5、用叶节点计数值的累加代表对父节点所表示区间的范围查询,根据叶节点上的条目计数值发布新数据集,直接供用户使用。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510862311.3/,转载请声明来源钻瓜专利网。