[发明专利]一种数据处理方法和装置有效

专利信息
申请号: 201810413389.0 申请日: 2018-05-03
公开(公告)号: CN110443060B 公开(公告)日: 2023-06-20
发明(设计)人: 李梁;周俊;李小龙 申请(专利权)人: 创新先进技术有限公司
主分类号: G06F21/62 分类号: G06F21/62
代理公司: 北京亿腾知识产权代理事务所(普通合伙) 11309 代理人: 陈霁;周良玉
地址: 开曼群岛大开曼岛*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据处理 方法 装置
【说明书】:

本说明书实施例公开了一种数据处理方法和装置,所述方法在数据处理服务器端执行,包括:获取将用于处理所述多个原始数据矩阵的差分隐私算法的差分隐私参数;相对于所述多个原始数据矩阵生成投影矩阵;从每个数据提供服务器端接收加密数据矩阵,其中,所述加密数据矩阵通过对对应的原始数据矩阵施加使用所述投影矩阵的差分隐私算法获得;以及将从每个数据提供服务器端接收的加密数据矩阵集合到一起,以用于整体学习。

技术领域

本说明书实施例涉及互联网技术领域,更具体地,涉及一种数据处理方法和装置。

背景技术

在互联网大数据建模分析需求下,如何保护用户的隐私是非常重要的问题。在该背景下,差分隐私技术得到越来越多的应用。差分隐私是一种对数据隐私安全性的形式化定义,其保证在对全部数据进行建模分析的同时并不泄露个体单条数据的信息。差分隐私是大数据建模分析需求之下对于个体隐私安全性的最合理保证。目前,差分隐私技术一般用于保护单个用户群体的隐私安全。在一种数据处理场景中,需要通过统一的方式对来自多个数据提供方的数据分别进行差分隐私处理,从而使得可以在将其处理过的数据集合在一起统一建模,并且同时还保护各方用户群体的用户隐私。因此,需要一种更有效的数据处理方案,以满足上述需求。

发明内容

本说明书实施例旨在提供一种更有效的数据处理方案,以解决现有技术中的不足。

为实现上述目的,本说明书一个方面提供一种数据处理方法,所述方法在数据处理服务器端执行,所述方法针对分别来自多个数据提供服务器端的多个原始数据矩阵,每个所述原始数据矩阵限定第一维度空间的多个点,其中,所述多个点的个数对应于多个向量的向量数,所述每个向量包括分别对应于多个特征的多个特征值,所述第一维度空间的维度数为所述多个特征的特征数,所述方法包括:获取将用于处理所述多个原始数据矩阵的差分隐私算法的差分隐私参数;相对于所述多个原始数据矩阵生成投影矩阵,所述投影矩阵用于:将每个所述原始数据矩阵限定的第一维度空间的多个点投影为第二维度空间的分别对应的点,并且使得,所述第二维度空间中的任意两点之间的欧氏距离与所述第一维度空间中对应两点之间的欧氏距离的比值在一定范围内,其中,基于所述第一维度空间的维度数和所述差分隐私参数确定所述第二维度空间的维度数;从每个数据提供服务器端接收加密数据矩阵,其中,所述加密数据矩阵通过对对应的原始数据矩阵施加使用所述投影矩阵的差分隐私算法获得;以及将从每个数据提供服务器端接收的加密数据矩阵集合到一起,以用于整体学习。

在一个实施例中,在所述数据处理方法中,所述差分隐私算法包括以下步骤:获取所述原始数据矩阵;将所述原始数据矩阵与所述投影矩阵相乘,以获取中间数据矩阵;基于所述原始数据矩阵、所述投影矩阵和所述差分隐私算法涉及的差分隐私参数,获取扰动矩阵;以及将所述中间数据矩阵与所述扰动矩阵相加,从而获取加密数据矩阵。

在一个实施例中,在所述数据处理方法中,所述扰动矩阵的每个矩阵元分别独立地从期望值为0的随机变量随机获得,其中,所述随机变量满足的分布的参数与所述差分隐私参数相关,其中,所述扰动矩阵的行数基于原始数据矩阵的行数而确定,所述扰动矩阵的列数基于所述投影矩阵的列数而确定。

在一个实施例中,在所述数据处理方法中,所述随机变量满足拉普拉斯分布或高斯分布。

在一个实施例中,在所述数据处理方法中,所述差分隐私算法为(ε,δ)-差分隐私算法,所述(ε,δ)-差分隐私算法涉及差分隐私参数ε和δ。在一个实施例中,所述参数ε和δ满足:

εln(1/δ),

其中,所述原始数据矩阵为n行d列矩阵,所述投影矩阵为d行k列的矩阵,则所述扰动矩阵为n行k列矩阵,其中,所述投影矩阵的每个矩阵元分别独立地从满足期望值为0、方差为1/k的高斯分布的随机变量随机获得,其中,

k2(lnd+ln(2/δ))

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810413389.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top