[发明专利]线性回归模型多维高斯差分隐私保护方法、信息安全系统有效
申请号: | 201810475546.0 | 申请日: | 2018-05-17 |
公开(公告)号: | CN108763954B | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 李效光;李晖;李凤华;朱辉 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F17/18 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 黄伟洪 |
地址: | 710071 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 线性 回归 模型 多维 高斯差分 隐私 保护 方法 信息 安全 系统 | ||
本发明属于保密或匿名技术领域,公开了一种线性回归模型多维高斯差分隐私保护方法、信息安全系统,对训练数据的不同属性定义不同的安全级别,在不同维度生成合适的噪声;计算线性回归模型的全局敏感度;根据定义的安全级别和全局敏感度生成高维高斯噪声的协方差矩阵;生成高维高斯噪声,加到输入和输出实现隐私保护。本发明给出量化隐私泄露的方法,根据不同维度的隐私需求生成合适的噪声,比已知的线性回归隐私保护方法在同样的隐私预算的情况下精度提高30%以上。本发明的时间开销仅仅是生成噪声的时间,不会因为数据维度的增加而有显著的变化,对于数据维度有较好的鲁棒性。本发明的加噪方式可以更灵活的根据隐私需求调整噪声的大小。
技术领域
本发明属于保密或匿名技术领域,尤其涉及一种线性回归模型多维高斯差分隐私保护方法、信息安全系统。
背景技术
目前,业内常用的现有技术是这样的:进入21世纪以来,互联网行业发展十分的迅速,随之而来的是人们通讯与数据共享的便利与快捷。然而,由此引发的隐私泄露风险也随之日益增长。近年来,隐私泄露事件时有发生;随着计算机技术的发展与网络攻击手段的不断丰富,保护隐私数据已远远不再是隐藏数据中敏感属性这么简单。随着近几年来数据挖掘等数据分析技术的快速发展,使得攻击者可以从海量数据中发掘出与用户隐私相关的信息,对隐私保护提出了新的挑战。而在数据挖掘中,线性回归是一个简单而又有效的技术,通过线性拟合训练数据集以得到一个机器学习模型。但是攻击者可以通过访问线性回归模型提供的接口来还原出来线性回归模型,获得训练数据集的数据分布。因此我们需要设计一种方案来抵御这种攻击。目前很多的隐私保护技术,但是并不能满足要求。目前已知的最好的保护线性回归的方案是在2011年被提出来的函数机制,该方案是通过在线性回归的代价函数中,给每个变量的系数加入拉普拉斯噪声,再通过优化方法求得最优的参数值来实现差分隐私保护,但是这样做的缺点在于,因为求解最优的参数值的过程是不可逆的,而且通常求解最优值的迭代算法都比较耗时,甚至有时加入噪声的代价函数不能收敛,这就导致了每次训练出来的模型都是一次性的,如果要更改噪声大小,就得重新训练模型,需要较大的时间开销。而且目前的方案里,没有定量的提出隐私预算参数如何选取。另外,在已有的一些方案中,没有考虑不同维度的隐私程度不同,因此加入了很多不必要的噪声。
综上所述,现有技术存在的问题是:目前的保护线性回归的方法把噪声加入线性回归的代价函数,导致每次训练出来的模型是一次性,重新训练模型耗时较长。
解决上述技术问题的难度和意义:导致了加入噪声后模型的不可逆,因此需要重新设计新的模型来实现可控的差分隐私保护,但是难点在于,不同的用户对数据的精度和隐私保护的程度不同,因此如何度量加入噪声的量与用户隐私的保护力度,以及用户能得到的数据精度的关系是一个难点。
解决上述问题的意义在于,通过给出度量加入噪声的量与用户隐私的保护力度,以及用户能得到的数据精度的关系的方法,能实现在线性回归模型中的隐私泄露的度量,根据度量结果就可以设计合适的参数,满足不同用户对于查询结果的不同需求。另外,有了隐私泄露的度量,就可以有效避免“过保护”情况,避免加入过多的噪声导致数据精度下降。
发明内容
针对现有技术存在的问题,本发明提供了一种线性回归模型多维高斯差分隐私保护方法、信息安全系统。
本发明是这样实现的,一种线性回归模型多维高斯差分隐私保护方法,所述线性回归模型多维高斯差分隐私保护方法对训练数据的不同属性定义不同的安全级别,在不同维度生成合适的噪声;计算线性回归模型的全局敏感度;根据定义的安全级别和全局敏感度生成高维高斯噪声的协方差矩阵;生成高维高斯噪声,加到输入和输出实现隐私保护。
进一步,所述对训练数据的不同属性定义不同的安全级别,在不同维度生成合适的噪声具体包括:
步骤一,对于训练数据集的每个维度,在每个输入维度i上设置一个合适的相似度si,用于限制攻击者能得到的模型和原始模型在这个维度上的最小相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810475546.0/2.html,转载请声明来源钻瓜专利网。