[发明专利]基于差分隐私的信用数据隐私保护方法及其系统有效
申请号: | 202110451141.5 | 申请日: | 2021-04-26 |
公开(公告)号: | CN112989425B | 公开(公告)日: | 2021-08-13 |
发明(设计)人: | 吕从东;张晓东;孙周宝 | 申请(专利权)人: | 南京审计大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 南京司南专利代理事务所(普通合伙) 32431 | 代理人: | 叶蕙 |
地址: | 210000 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 隐私 信用 数据 保护 方法 及其 系统 | ||
1.一种基于差分隐私的信用数据隐私保护方法,其特征在于,包括如下步骤:
S1:用户输入参数,其中输入参数包括:信用数据集和对应信用数据集的隐私保护需求参数,设定隐私保护需求参数的数值为正整数,其范围为1-4;
S2:设定隐私保护需求参数的每个数值对应一个算法;
S3:根据用户提供调用接口获取用户的信用数据集;
S4:获取信用数据集的隐私保护需求参数的数值;
S5:根据隐私保护需求参数的数值采用对应的算法得到隐私保护处理后的信用数据集,得到所述隐私保护处理后的信用数据集的具体方法如下:
如果隐私保护需求参数的数值等于1,则调用单列隐私保护算法,所述单列隐私保护算法针对单列的隐私保护,对这一列中所有的数据,使用相同的输入参数进行计算,得到隐私保护处理后的信用数据集传送给数据使用者;
所述单列隐私保护算法输入的参数包括信用数据集、列数和隐私保护参数,所述单列隐私保护算法的具体步骤如下:
步骤1:如果列号向量为空,即用户不指定列号,则使用随机函数随机生成列号;如果隐私保护参数向量为空,即用户不指定隐私保护参数,则使用随机函数随机生成隐私保护参数;
步骤2:读取列中每一个单元格中的值,使用拉普拉斯分布函数及隐私保护参数计算噪声,隐私保护处理后的信用数据集等于原始数据加上噪声;
步骤3:将隐私保护处理后的信用数据集写回表中,即输出隐私保护处理后的信用数据集;
如果隐私保护需求参数的数值等于2,则调用多列隐私保护算法,所述多列隐私保护算法的每一列都使用相同的输入参数,使用相同的输入参数进行计算,得到隐私保护处理后的信用数据集传送给数据使用者;
所述多列隐私保护算法输入的参数包括多列的信用数据集、列号向量和隐私保护参数;所述多列隐私保护算法的具体步骤如下:
步骤1:如果列号向量为空,即用户不指定列号,则使用随机函数随机生成列号;如果隐私保护参数向量空,即用户不指定隐私保护参数,则使用随机函数随机生成隐私保护参数;
步骤2:对于每一列,读取列中每一个单元格中的值以及隐私保护参数,然后使用拉普拉斯分布函数和相同隐私保护参数进行计算噪声,隐私保护处理后的信用数据集等于原始数据加上噪声;
步骤3:将隐私保护处理后的信用数据集写回表中;
如果隐私保护需求参数的数值等于3,则调用多列非同隐私保护算法,所述多列非同隐私保护算法对每列中所有的数据使用相同的输入参数进行计算,不同列使用不同的输入参数,最后把隐私保护处理后的信用数据集传送给数据使用者;
所述多列非同隐私保护算法输入的参数包括多列的信用数据集、列号向量和隐私保护参数向量,所述多列非同隐私保护算法的具体步骤如下:
步骤1:如果列号向量为空,即用户不指定列号,则使用随机函数随机生成列号;
步骤2:如果隐私保护参数向量为空,即用户不指定隐私保护参数,则使用随机函数随机生成隐私保护参数;
步骤3:对于每一列,读取列中每一个单元格中的值以及该列的隐私保护参数,然后使用拉普拉斯分布函数和隐私保护参数进行计算噪声,隐私保护处理后的信用数据集于原始数据加上噪声;
步骤4:将隐私保护处理后的信用数据集写回表中;
如果隐私保护需求参数的数值等于4,则调用单行多列非同隐私保护算法,所述单行多列非同隐私保护算法对该行不同列的数据,使用不同的输入参数进行计算,得到隐私保护处理后的信用数据集传送给数据使用者;
所述单行多列非同隐私保护算法输入的参数包括单行多列的信用数据集、行号、列号向量和隐私保护参数向量;所述单行多列非同隐私保护算法的具体步骤如下:
步骤1:如果行号不存在或者列号向量为空,即用户不指定行号、列号,则使用随机函数随机生成行号和多列号;如果隐私保护参数向量为空,即用户指定多个隐私保护参数,如果用户不指定隐私保护参数,则使用随机函数随机生成多个隐私保护参数;
步骤2:读取列中每一个单元格中的值,然后使用拉普拉斯分布函数和隐私保护参数进行计算噪声,隐私保护处理后的信用数据集等于原始数据加上噪声;
步骤3:将隐私保护处理后的信用数据集写回表中。
2.一种基于差分隐私的信用数据隐私保护方法的系统,采用权利要求1所述方法,其特征在于,其包括:
数据采集模块,用于根据用户提供调用接口获取用户的信用数据集;
参数获取模块,用于获取信用数据集的隐私保护需求参数的数值,其中隐私保护需求参数的数值为正整数,且范围为1-4;
算法调用模块,用于根据输入参数获取隐私保护处理后的信用数据集;
其中算法调用模块包括调用单列隐私保护算法的第一算法调用模块、调用多列隐私保护算法的第二算法调用模块、调用多列非同隐私保护算法的第三算法调用模块和调用单行多列非同隐私保护算法的第四算法调用模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京审计大学,未经南京审计大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110451141.5/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置