[发明专利]一种个性化隐私数据处理方法、装置、介质及计算机设备有效
申请号: | 202110431729.4 | 申请日: | 2021-04-21 |
公开(公告)号: | CN113094751B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 郭山清;唐朋;胡程瑜;白兴涛;刘高源;张芷源 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张庆骞 |
地址: | 266237 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 个性化 隐私 数据处理 方法 装置 介质 计算机 设备 | ||
本发明属于数据安全与隐私保护领域,提供了一种个性化隐私数据处理方法、装置、介质及计算机设备。其中,该方法包括基于局部数据集计算数据拥有者的给定属性的计数向量;对数据拥有者的计数向量进行加权聚合,并在聚合结果中注入拉普拉斯噪音,以满足差分隐私保护要求;根据包含噪音的聚合结果,计算属性的边际分布;根据属性的边际分布,利用最大期望算法校正属性的边际分布,以用于分析不同属性数据之间的关联关系且同时保证每个局部数据集的个性化隐私保护。
技术领域
本发明属于数据安全与隐私保护领域,尤其涉及一种个性化隐私数据处理方法、装置、介质及计算机设备。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
分布式场景下,在共同利用多组水平分割数据,计算给定属性(或属性集合)的全局边际分布的过程中,存在数据隐私保护问题。其中,水平分割数据指的是数据拥有相同的属性,但包含不同的个体,如多组医疗数据。
数据中往往包含大量的个人敏感信息,由于数据分布、数据中个体的不同,不同的局部数据集隐私强度要求往往不同。因此,在实际利用水平分割数据计算属性(或属性集合)的边际分布的过程中,需要考虑如何满足数据拥有者不同强度的隐私保护需求,同时考虑如何最大限度的减少隐私保护对统计结果带来的精度损失的问题。现有隐私数据处理的过程为:对原始数据集中记录进行采样,得到采样数据集,接着利用采样数据集计算属性(或属性集合)的边际分布,并在计算结果中加入适量噪音以满足差分隐私保护要求。以上方法相当于对关于原始数据集的统计信息进行了随机扰动以达到隐私保护目的。其随机性来自于两方面,一方面是随机采样对原始数据集中每条记录带来的随机性,另一方面是差分隐私中噪音对采样数据集中每条记录带来的随机性。在差分隐私中的噪音对采样数据集中每条记录带来的随机性相同的条件下,通过对原始数据集中记录进行不同概率的采样,即隐私强度需求大的被选中的概率小,隐私强度需求小的被选中的概率大,以调整采样方法对原始数据集中不同隐私强度需求的记录带来的随机性大小,进而从整体上满足原始数据集中不同记录的隐私保护强度需求。然而,发明人发现,对于利用水平分割数据计算属性的边际分布统计结果精度来讲,以上方法会对统计结果精度带来两方面误差,一方面是差分隐私中噪音带来的误差,一方面是采样带来的误差,这将影响统计结果精度,这样无法准确分析不同属性数据之间的关联关系以及保证每个局部数据集的个性化隐私保护。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供一种个性化隐私数据处理方法、装置、介质及计算机设备,其采用加权聚合技术和基于混合多项分布的校正技术,在为每一方提供个性化的差分隐私保护的同时,能够正确计算属性(或属性集合)在水平分割数据中全局边际分布,能够准确出分析不同属性数据之间的关联关系且同时保证每个局部数据集的个性化隐私保护的目的。为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供一种个性化隐私数据处理方法。
一种个性化隐私数据处理方法,其包括:
基于局部数据集计算数据拥有者的给定属性的计数向量;
对数据拥有者的计数向量进行加权聚合,并在聚合结果中注入拉普拉斯噪音,以满足差分隐私保护要求;
根据包含噪音的聚合结果,计算属性的边际分布;
根据属性的边际分布,利用最大期望算法校正属性的边际分布,以用于分析不同属性数据之间的关联关系且同时保证每个局部数据集的个性化隐私保护。
进一步地,所述计数向量采用数据拥有者在本地基于局部数据集计算的给定属性或属性组合的直方图信息来表示。
进一步地,对数据拥有者的计数向量进行加权聚合的过程中,每个局部数据集的权重为相应局部数据集的隐私预算与所有局部数据集的隐私预算最大值的比值。
进一步地,每个局部数据集的隐私预算为公开信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110431729.4/2.html,转载请声明来源钻瓜专利网。