[发明专利]基于贝叶斯网络属性聚类分析技术的高维隐私数据发布方法在审
申请号: | 202011013027.6 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112131604A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 陈恒恒;刘胜军;谢飞;倪志伟;陈千;李海松;卜繁耀;朱旭辉 | 申请(专利权)人: | 合肥城市云数据中心股份有限公司;合肥工业大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62 |
代理公司: | 合肥国和专利代理事务所(普通合伙) 34131 | 代理人: | 张祥骞 |
地址: | 230031 安徽省合肥市高新区玉*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 贝叶斯 网络 属性 聚类分析 技术 隐私 数据 发布 方法 | ||
本发明涉及基于贝叶斯网络属性聚类分析技术的高维隐私数据发布方法,与现有技术相比解决了高维隐私数据加噪发布误差大、可用性差、效率低的缺陷。本发明包括以下步骤:高维数据的获取;属性子集的聚类划分;构建加噪贝叶斯网络;生成加噪条件分布;合成数据集的发布。高维大数据环境下,本发明可在确保数据隐私安全与可用性的同时,缩短数据发布算法的运行时间,实现高维大数据环境下隐私数据的有效发布。
技术领域
本发明涉及高维数据隐私处理技术领域,具体来说是基于贝叶斯网络属性聚类分析技术的高维隐私数据发布方法。
背景技术
随着信息技术的不断发展和应用,各行各业的信息系统中都积累了丰富的数据资源,这些数据往往蕴含着巨大的研究价值。然而,由于原始数据里通常包含着许多个人的隐私信息,直接将其进行发布将导致敏感信息泄露。因此,在发布数据之前,需要使用特殊的隐私防护技术对数据进行处理。传统的隐私保护技术(如k-匿名、l-多样性和t-保密等)能够在一定程度上保护个人隐私,但都很难抵御背景知识攻击,远不足以保证隐私信息的安全。差分隐私的提出为隐私发布提供了新的解决思路,其能量化对数据隐私的保护强度,为数据发布提供更为强大的隐私保护。
现有研究对低维数据的发布问题做了诸多努力,但随着大数据时代的来临,高维数据在现实生活中更加普遍存在。对于高维数据,直接使用低维数据的发布方法会引入极大的噪音值,进而使得发布结果的可用性较低,其主要原因在于维度与维度值域的增加会带来“维度灾难”和“值域多样”等问题。因此,如何解决高维数据发布的隐私问题和数据的低效用性问题,成为新的研究焦点。
解决高维数据发布问题通常使用的方法是降维。先对数据降维得到低维数据,对转换后的低维数据集添加噪声,进而生成新的数据集进行发布。Qardaji等人(见文献Qardaji W H,Yang Weining,Li Ninghui.Priview:Practical differentially privaterelease of marginal contingency tables[C].Proc of the 2014ACM SIGMOD Int Confon Management of Data.New York:ACM,2014:1435-1446)提出的Priview方法通过构建属性对的K-way边缘分布来估计高维数据的联合分布。Day等人(见文献Day W Y,LiNingHui.Differentially Private publishing of high-dimensional data Releaseusing sensitivity control[C].Proc of the 10th ACM Symp on Information,Computerand Communication Security(ASIACCS 2015).New York:ACM,2015,451-462)提出了一种基于阈值过滤技术的差分隐私发布方法,通过构建低敏感度质量函数,达到限制敏感度范围的目的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥城市云数据中心股份有限公司;合肥工业大学,未经合肥城市云数据中心股份有限公司;合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011013027.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种超临界二氧化碳透平气缸轴封冷却结构
- 下一篇:一种藤椅木柄自动绕藤工艺