[发明专利]一种基于互信息相关技术的差分隐私动态数据发布方法在审
申请号: | 202011014417.5 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112131605A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 冉家敏;刘胜军;谢飞;倪志伟;陈千;丁正;朱旭辉;倪丽萍 | 申请(专利权)人: | 合肥城市云数据中心股份有限公司;合肥工业大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62;G06N7/08 |
代理公司: | 合肥国和专利代理事务所(普通合伙) 34131 | 代理人: | 张祥骞 |
地址: | 230031 安徽省合肥市高新区玉*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 互信 相关 技术 隐私 动态 数据 发布 方法 | ||
本发明涉及一种基于互信息相关技术的差分隐私动态数据发布方法,与现有技术相比解决了噪声积累多、隐私预算分配不当、数据可用性差的缺陷。本发明包括以下步骤:动态数据流的获取;动态数据流的分割;初始聚类处理;待发布分组的形成;分组数据的发布;差分隐私动态数据的发布。本发明根据动态数据流的特点,采用分形技术对数据进行聚类处理,并利用互信息相关知识进行聚类成员选择,最后结合差分隐私技术对聚类结果添加隐私保护再发布数据,从而提高动态数据发布的安全性及数据的可用性。
技术领域
本发明涉及动态数据隐私发布技术领域,具体来说是一种基于互信息相关技术的差分隐私动态数据发布方法。
背景技术
在混合云数据中心中,不仅存在定期收集的静态数据,也会有源源不断的动态数据流进入,常见的交通流数据、在线交易数据、环境监测数据等均属于动态数据,这些数据通常以一种实时、连续不断、非匀速的方式到达,而且通常类型繁杂、数量无法预知。在对这类数据进行统计发布时,一方面可以挖掘其中蕴含的价值,但另一方面也存在隐私信息泄漏的危险,为了对隐私数据进行保护,不少研究者对此进行了研究。
为了保护隐私信息的安全性,研究使用泛化、抑制等方法隐藏敏感信息实现对数据的保护,通常采用k-匿名(SWEENEY L.k-anonymity:a model for protecting privacy[J].Inter-national Journal on Uncertainty,Fuzziness and Knowledge-basedSystems,2002,10(5):557-570)以及在其基础上改进的l-多样性(MACHANAVAJJHALA A,KIFER D,GEHRKE J,et al.l-diversity:privacy beyond k-anonymity[C]//Proc of the22nd International Conference on Data Engineering.Washington DC:IEEE ComputerSociety,2006:24-35)、t-保密性(Li N,Li T,Venkatasubramanian S.t-closeness:Privacy beyond k-anonymity and l-diversity[C]//Data Engineering,2007.ICDE2007.IEEE 23rd International Conference on.IEEE,2007:106-115)等方法进行数据发布隐私保护。
但上述隐私保护方法在现实应用中仍然存在不小的局限性,只能针对特定的攻击手段。近年来,为了抵抗背景知识攻击,差分隐私技术应运而生,该技术可保证即使攻击者获取所能得到的最大背景知识,也无法获取用户的隐私信息,因而结合差分隐私技术的数据发布方法逐渐流行起来(屈晶晶,蔡英,夏红科.面向动态数据发布的差分隐私保护研究综述[J].北京信息科技大学学报(自然科学版),2019,34(06):30-36)。
目前,由于数据中心中动态数据体量庞大,针对动态数据的数据发布问题需求强烈,但由于和静态数据特征的不同,导致静态数据的差分隐私发布方法无法支撑动态数据发布。同时,由于动态数据流需要快速而准确的进行统计发布,在进行差分隐私数据发布时通常容易出现噪声积累过多、隐私预算分配不当、数据可用性降低等问题,从而导致数据发布结果误差大,隐私容易泄露等后果。
发明内容
本发明的目的是为了解决现有技术中噪声积累多、隐私预算分配不当、数据可用性差的缺陷,提供一种基于互信息相关技术的差分隐私动态数据发布方法来解决上述问题。
为了实现上述目的,本发明的技术方案如下:
一种基于互信息相关技术的差分隐私动态数据发布方法,包括以下步骤:
动态数据流的获取:获取待处理的动态数据流;
动态数据流的分割:利用滑动窗口技术对动态数据流进行分割,使数据以静态方式展示在滑动窗口中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥城市云数据中心股份有限公司;合肥工业大学,未经合肥城市云数据中心股份有限公司;合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011014417.5/2.html,转载请声明来源钻瓜专利网。