[发明专利]一种个性化隐私数据处理方法、装置、介质及计算机设备有效
申请号: | 202110431729.4 | 申请日: | 2021-04-21 |
公开(公告)号: | CN113094751B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 郭山清;唐朋;胡程瑜;白兴涛;刘高源;张芷源 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张庆骞 |
地址: | 266237 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 个性化 隐私 数据处理 方法 装置 介质 计算机 设备 | ||
1.一种个性化隐私数据处理方法,其特征在于,用于对水平分割数据进行带差分隐私保护的全局边际分布计算,包括:
基于局部数据集计算数据拥有者的给定属性的计数向量;
对数据拥有者的计数向量进行加权聚合,并在聚合结果中注入拉普拉斯噪音,以满足差分隐私保护要求;
根据包含噪音的聚合结果,计算属性的边际分布;
根据属性的边际分布,利用最大期望算法校正属性的边际分布,以用于分析不同属性数据之间的关联关系且同时保证每个局部数据集的个性化隐私保护;
所述计数向量采用数据拥有者在本地基于局部数据集计算的给定属性或属性组合的直方图信息来表示;
对数据拥有者的计数向量进行加权聚合的过程中,每个局部数据集的权重为相应局部数据集的隐私预算与所有局部数据集的隐私预算最大值的比值。
2.如权利要求1所述的个性化隐私数据处理方法,其特征在于,每个局部数据集的隐私预算为公开信息。
3.如权利要求1所述的个性化隐私数据处理方法,其特征在于,在聚合结果中注入拉普拉斯噪音的过程是在密文下进行的。
4.如权利要求1所述的个性化隐私数据处理方法,其特征在于,拉普拉斯噪音η=-λ·sgn(u)·ln(1-2|u|),其中,u为区间内服从均匀分布的连续的随机变量,λ为常系数。
5.如权利要求1所述的个性化隐私数据处理方法,其特征在于,利用最大期望算法校正属性的边际分布之前,还包括构造似然函数,利用似然函数将数据集边界的问题转换为有约束最大化问题。
6.一种个性化隐私数据处理系统,其特征在于,采用如权利要求1-5任一项所述的一种个性化隐私数据处理方法,包括:
计数向量计算模块,其用于基于局部数据集计算数据拥有者的给定属性的计数向量;
加权聚合模块,其用于对数据拥有者的计数向量进行加权聚合,并在聚合结果中注入拉普拉斯噪音,以满足差分隐私保护要求;
边际分布计算模块,其用于根据包含噪音的聚合结果,计算属性的边际分布;
边际分布校正模块,其用于根据属性的边际分布,利用最大期望算法校正属性的边际分布,以用于分析不同属性数据之间的关联关系且同时保证每个局部数据集的个性化隐私保护。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一项所述的个性化隐私数据处理方法中的步骤。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5中任一项所述的个性化隐私数据处理方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110431729.4/1.html,转载请声明来源钻瓜专利网。