[发明专利]基于差分隐私的信用数据隐私保护方法及其系统有效

专利信息
申请号: 202110451141.5 申请日: 2021-04-26
公开(公告)号: CN112989425B 公开(公告)日: 2021-08-13
发明(设计)人: 吕从东;张晓东;孙周宝 申请(专利权)人: 南京审计大学
主分类号: G06F21/62 分类号: G06F21/62
代理公司: 南京司南专利代理事务所(普通合伙) 32431 代理人: 叶蕙
地址: 210000 江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 隐私 信用 数据 保护 方法 及其 系统
【权利要求书】:

1.一种基于差分隐私的信用数据隐私保护方法,其特征在于,包括如下步骤:

S1:用户输入参数,其中输入参数包括:信用数据集和对应信用数据集的隐私保护需求参数,设定隐私保护需求参数的数值为正整数,其范围为1-4;

S2:设定隐私保护需求参数的每个数值对应一个算法;

S3:根据用户提供调用接口获取用户的信用数据集;

S4:获取信用数据集的隐私保护需求参数的数值;

S5:根据隐私保护需求参数的数值采用对应的算法得到隐私保护处理后的信用数据集,得到所述隐私保护处理后的信用数据集的具体方法如下:

如果隐私保护需求参数的数值等于1,则调用单列隐私保护算法,所述单列隐私保护算法针对单列的隐私保护,对这一列中所有的数据,使用相同的输入参数进行计算,得到隐私保护处理后的信用数据集传送给数据使用者;

所述单列隐私保护算法输入的参数包括信用数据集、列数和隐私保护参数,所述单列隐私保护算法的具体步骤如下:

步骤1:如果列号向量为空,即用户不指定列号,则使用随机函数随机生成列号;如果隐私保护参数向量为空,即用户不指定隐私保护参数,则使用随机函数随机生成隐私保护参数;

步骤2:读取列中每一个单元格中的值,使用拉普拉斯分布函数及隐私保护参数计算噪声,隐私保护处理后的信用数据集等于原始数据加上噪声;

步骤3:将隐私保护处理后的信用数据集写回表中,即输出隐私保护处理后的信用数据集;

如果隐私保护需求参数的数值等于2,则调用多列隐私保护算法,所述多列隐私保护算法的每一列都使用相同的输入参数,使用相同的输入参数进行计算,得到隐私保护处理后的信用数据集传送给数据使用者;

所述多列隐私保护算法输入的参数包括多列的信用数据集、列号向量和隐私保护参数;所述多列隐私保护算法的具体步骤如下:

步骤1:如果列号向量为空,即用户不指定列号,则使用随机函数随机生成列号;如果隐私保护参数向量空,即用户不指定隐私保护参数,则使用随机函数随机生成隐私保护参数;

步骤2:对于每一列,读取列中每一个单元格中的值以及隐私保护参数,然后使用拉普拉斯分布函数和相同隐私保护参数进行计算噪声,隐私保护处理后的信用数据集等于原始数据加上噪声;

步骤3:将隐私保护处理后的信用数据集写回表中;

如果隐私保护需求参数的数值等于3,则调用多列非同隐私保护算法,所述多列非同隐私保护算法对每列中所有的数据使用相同的输入参数进行计算,不同列使用不同的输入参数,最后把隐私保护处理后的信用数据集传送给数据使用者;

所述多列非同隐私保护算法输入的参数包括多列的信用数据集、列号向量和隐私保护参数向量,所述多列非同隐私保护算法的具体步骤如下:

步骤1:如果列号向量为空,即用户不指定列号,则使用随机函数随机生成列号;

步骤2:如果隐私保护参数向量为空,即用户不指定隐私保护参数,则使用随机函数随机生成隐私保护参数;

步骤3:对于每一列,读取列中每一个单元格中的值以及该列的隐私保护参数,然后使用拉普拉斯分布函数和隐私保护参数进行计算噪声,隐私保护处理后的信用数据集于原始数据加上噪声;

步骤4:将隐私保护处理后的信用数据集写回表中;

如果隐私保护需求参数的数值等于4,则调用单行多列非同隐私保护算法,所述单行多列非同隐私保护算法对该行不同列的数据,使用不同的输入参数进行计算,得到隐私保护处理后的信用数据集传送给数据使用者;

所述单行多列非同隐私保护算法输入的参数包括单行多列的信用数据集、行号、列号向量和隐私保护参数向量;所述单行多列非同隐私保护算法的具体步骤如下:

步骤1:如果行号不存在或者列号向量为空,即用户不指定行号、列号,则使用随机函数随机生成行号和多列号;如果隐私保护参数向量为空,即用户指定多个隐私保护参数,如果用户不指定隐私保护参数,则使用随机函数随机生成多个隐私保护参数;

步骤2:读取列中每一个单元格中的值,然后使用拉普拉斯分布函数和隐私保护参数进行计算噪声,隐私保护处理后的信用数据集等于原始数据加上噪声;

步骤3:将隐私保护处理后的信用数据集写回表中。

2.一种基于差分隐私的信用数据隐私保护方法的系统,采用权利要求1所述方法,其特征在于,其包括:

数据采集模块,用于根据用户提供调用接口获取用户的信用数据集;

参数获取模块,用于获取信用数据集的隐私保护需求参数的数值,其中隐私保护需求参数的数值为正整数,且范围为1-4;

算法调用模块,用于根据输入参数获取隐私保护处理后的信用数据集;

其中算法调用模块包括调用单列隐私保护算法的第一算法调用模块、调用多列隐私保护算法的第二算法调用模块、调用多列非同隐私保护算法的第三算法调用模块和调用单行多列非同隐私保护算法的第四算法调用模块。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京审计大学,未经南京审计大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110451141.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top