[发明专利]基于贝叶斯网络属性聚类分析技术的高维隐私数据发布方法在审
申请号: | 202011013027.6 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112131604A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 陈恒恒;刘胜军;谢飞;倪志伟;陈千;李海松;卜繁耀;朱旭辉 | 申请(专利权)人: | 合肥城市云数据中心股份有限公司;合肥工业大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62 |
代理公司: | 合肥国和专利代理事务所(普通合伙) 34131 | 代理人: | 张祥骞 |
地址: | 230031 安徽省合肥市高新区玉*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 贝叶斯 网络 属性 聚类分析 技术 隐私 数据 发布 方法 | ||
1.一种基于贝叶斯网络属性聚类分析技术的高维隐私数据发布方法,其特征在于,包括以下步骤:
11)高维数据的获取:获取待发布的高维数据形成原始数据集D,对高维数据进行属性归纳,形成高维数据属性集;
12)属性子集的聚类划分:通过计算高维数据属性之间的相关性,利用属性聚类方法将高维属性集划分成c个属性子集,进而根据属性子集将原始数据集D划分成c个数据子集Di(i=1,..,c);
13)构建加噪贝叶斯网络:使用贪婪贝叶斯方法对得到的数据子集Di(i=1,..,c)构建加噪贝叶斯网络Ni(i=1,..,c),其中,分配的总隐私预算为ε1,每个数据子集根据拥有的属性个数占c个属性子集簇拥有的总属性个数比例分配隐私预算使构建的每个贝叶斯网络满足ε1i的差分隐私;
14)生成加噪条件分布:对于每一个贝叶斯网络Ni,计算其联合概率分布Pr[Vi,∏i]并加噪得到Pr*[Vi,∏i],据此计算加噪条件概率分布Pr*[Vi|∏i],其中,分配的总隐私预算为ε2,每个贝叶斯网络根据属性节点个数占c个贝叶斯网络拥有的总属性节点个数比例分配隐私预算使构建的每个条件概率分布满足ε2i的差分隐私;ε1与ε2之和等于给定的总隐私预算ε,即ε=ε1+ε2,使得整个数据发布过程满足ε的差分隐私;
15)合成数据集的发布:对于c个数据子集,根据其贝叶斯网络Ni和加噪条件分布Pr*[Vi|∏i]以i的增加顺序依次采样每个属性,生成扰动数据集根据此生成合成数据集D*,合成数据集D*即为高维隐私数据,最终将高维隐私数据进行发布。
2.根据权利要求1所述的基于贝叶斯网络属性聚类分析技术的高维隐私数据发布方法,其特征在于,所述属性子集的聚类划分包括以下步骤:
21)针对高维数据集,计算高维数据属性之间的相关性,其计算方法如下:
给定任意两个属性Vi和Vj,属性之间相对依赖关系表示为
其中,I代表两个属性之间的互信息,H代表两个属性之间的联合熵值;对于任意一个属性Vi,它到其他属性的关系和表示为
22)随机选择c个属性作为中心属性,其中c是属性子集的个数;
23)对于计算Vi与各中心属性之间的相对依赖关系,并将其分配给依赖值最大的中心属性Cr所在子集簇,重复此步骤直至分配完所有属性;
24)更新中心属性,对于每一个属性子集,如果有属性Vi到其他属性的关系和大于中心属性到其他属性的关系和,即MR(Vi)≥MR(Vj)(Vj∈Cr,j≠i),则将Vi设置为新的Cr;
25)重复23)步骤与24)步骤直到c个中心属性不变,或者当迭代次数达到预设定值时,终止迭代,得到c个属性子集,进而得到c个数据子集Di(i=1,..,c)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥城市云数据中心股份有限公司;合肥工业大学,未经合肥城市云数据中心股份有限公司;合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011013027.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种超临界二氧化碳透平气缸轴封冷却结构
- 下一篇:一种藤椅木柄自动绕藤工艺