[发明专利]一种基于差分隐私的空间数据划分方法有效
申请号: | 201811574620.0 | 申请日: | 2018-12-21 |
公开(公告)号: | CN109726587B | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 蔡苏瑾 | 申请(专利权)人: | 盐城师范学院 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华;于瀚文 |
地址: | 224002 江苏省盐城市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 隐私 空间 数据 划分 方法 | ||
1.一种基于差分隐私的空间数据划分方法,其特征在于,包括如下步骤:
步骤1,对原始数据集D进行固定值的网格划分并添加拉普拉斯噪声,合成新的数据集Dc;
步骤2,用IH树划分算法对合成数据集Dc进行分割;
步骤3,用得到的分割点划分原始数据集D,并进行剩余隐私预算的加噪;
步骤4,对最后的结果进行一致性约束处理;
步骤1包括以下步骤:
步骤1-1、将原始数据集D划分为β个均匀的网格,β的值设置为:
其中,N为数据集D中数据点的个数,ε是差分隐私的隐私预算,c为一个常数;
步骤1-2、对每个网格单元格添加隐私预算为αε的拉普拉斯噪声;
步骤1-3、根据添加拉普拉斯噪声后的计数结果合成新的数据集Dc,合成数据集的具体步骤为:
若添加拉普拉斯噪声后的计数比真实计数多s个,则在该单元格内任意添加s个数据点;若添加拉普拉斯噪声后的计数比真实计数少s个,则在该单元格内任意删除s个数据点;若添加拉普拉斯噪声后的计数为负值,将计数值修改为0;
步骤2包括以下步骤:
步骤2-1、分别计算原始数据集D中数据点不同维度的方差,方差的计算公式为:
其中,xi为第i个数据点的经度值,1≤i≤N,yj为第j个数据点的纬度值,1≤j≤N,则Mx为经度的平均值,My为纬度的平均值,Sx为经度的方差,Sy为纬度的方差,比较Sx与Sy的大小,若Sx大于Sy,则将经度作为第一维度先划分,若Sy大于Sx,则从纬度先划分,若Sx等于Sy,则随机选择一个维度先划分;
步骤2-2、对第一维度进行m-1次划分,得到m个数据块:
其中,ε为差分隐私的隐私预算;
步骤2-3、用步骤2-2的方法分别对这m个数据块的第二维度进行划分;
步骤2-4、返回划分后的m*m个数据块。
2.根据权利要求1所述的方法,其特征在于,步骤2-2中,寻找第一维度的中位数对其进行分割,将数据集Dc分为Dc1和Dc2,分别寻找Dc1和Dc2的中位数,再对这两个数据块进行划分,如此递归,进行m-1次划分后,最终得到m个数据块。
3.根据权利要求2所述的方法,其特征在于,步骤3包括:对划分后得到的m*m个数据块分别添加剩余的(1-α)ε的隐私预算。
4.根据权利要求3所述的方法,其特征在于,步骤4包括以下步骤:
步骤4-1,构建索引树,整个原始数据集的空间域作为根结点,将第一维度划分的m个数据块作为第一层的中间结点,对每一个数据块的第二维度进行划分得到的m个结点,作为该中间结点的叶子结点;
步骤4-2、如果结点为非叶子结点,执行如下计算:
sum=∑child∈nodeYchild,
adjust=(Ynode-sum)/len(children(node))+1,
Ynode=Ynode-adjust;
如果结点是叶子结点,执行如下计算:Ychild=Ychild+adjust;
其中,node为中间结点,child为该中间结点的叶子结点,Ychild为叶子结点的加噪计数值,Ynode为中间结点的加噪计数值,sum为该中间结点所有孩子结点的加噪计数值总和;
len(children(node))为该中间结点的叶子结点的个数,即为m;
adjust为调整值;
如果结点为中间结点,将中间结点的计数值调整为Ynode=Ynode-adjust,如果结点为叶子结点,将叶子结点的计数值调整为Ychild=Ychild+adjust;
步骤4-3、将最终的数据集R发布,数据集R的发布形式为:
m*m个数据块的四个顶点的坐标以及该数据块中的加噪计数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盐城师范学院,未经盐城师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811574620.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置