[发明专利]一种数据处理方法和装置有效
申请号: | 201810413389.0 | 申请日: | 2018-05-03 |
公开(公告)号: | CN110443060B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 李梁;周俊;李小龙 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 开曼群岛大开曼岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 | ||
1.一种数据处理方法,所述方法在数据处理服务器端执行,所述方法用于分别来自多个数据提供服务器端的多个原始数据矩阵,每个所述原始数据矩阵限定第一维度空间的多个点,其中,所述多个点的个数对应于多个向量的向量数,每个向量包括分别对应于多个特征的多个特征值,所述第一维度空间的维度数为所述多个特征的特征数,所述方法包括:
获取将用于处理所述多个原始数据矩阵的差分隐私算法的差分隐私参数;
相对于所述多个原始数据矩阵生成投影矩阵,所述投影矩阵用于:将每个所述原始数据矩阵限定的第一维度空间的多个点投影为第二维度空间的分别对应的点,并且使得,所述第二维度空间中的任意两点之间的欧氏距离与所述第一维度空间中对应两点之间的欧氏距离的比值在一定范围内,其中,所述第二维度空间的维度数基于所述第一维度空间的维度数和所述差分隐私参数而确定;
从每个数据提供服务器端接收加密数据矩阵,其中,所述加密数据矩阵通过对对应的原始数据矩阵施加使用所述投影矩阵的差分隐私算法获得,具体包括:获取所述原始数据矩阵;将所述原始数据矩阵与所述投影矩阵相乘,以获取中间数据矩阵;基于所述原始数据矩阵、所述投影矩阵和所述差分隐私参数,获取扰动矩阵;以及将所述中间数据矩阵与所述扰动矩阵相加,从而获取加密数据矩阵;以及
将从每个数据提供服务器端接收的加密数据矩阵集合到一起,以用于整体学习。
2.根据权利要求1所述的数据处理方法,其中所述扰动矩阵的每个矩阵元分别独立地从期望值为0的随机变量随机获得,其中,所述随机变量满足的分布的参数与所述差分隐私参数相关,其中,所述扰动矩阵的行数基于原始数据矩阵的行数而确定,所述扰动矩阵的列数基于所述投影矩阵的列数而确定。
3.根据权利要求2所述的数据处理方法,其中,所述随机变量满足拉普拉斯分布或高斯分布。
4.根据权利要求2所述的数据处理方法,所述差分隐私算法为(ε,δ)-差分隐私算法,所述(ε,δ)-差分隐私算法包括差分隐私参数ε和δ。
5.根据权利要求4所述的数据处理方法,其中所述参数ε和δ满足:
εln(1/δ),
其中,所述原始数据矩阵为n行d列矩阵,所述投影矩阵为d行k列的矩阵,则所述扰动矩阵为n行k列矩阵,其中,所述投影矩阵的每个矩阵元分别独立地从满足期望值为0、方差为1/k的高斯分布的随机变量随机获得,其中,
k2(lnd+ln(2/δ))
以及,所述扰动矩阵的每个矩阵元分别独立地从满足期望值为0、方差为σ2的高斯分布的随机变量随机获得,其中,所述σ满足:
6.根据权利要求1所述的数据处理方法,其中,所述投影矩阵从随机矩阵随机获得,所述随机矩阵的每个矩阵元为随机变量,各个所述随机变量相互独立且具有相同分布,其中所述随机矩阵满足:所述随机矩阵的转置与所述随机矩阵的乘积的期望值为单位矩阵。
7.根据权利要求6所述的数据处理方法,其中,所述第二维度空间为k维空间,所述随机变量满足期望值为0、方差为1/k的高斯分布。
8.根据权利要求6所述的数据处理方法,其中,所述第二维度空间为k维空间,所述随机变量满足在上的均匀分布。
9.根据权利要求6所述的数据处理方法,其中,所述第二维度空间为k维空间,所述随机变量满足分别以的概率取值0、的分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810413389.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据保护方法及装置
- 下一篇:一种数据加密方法和装置