[发明专利]一种基于安全两方计算线性回归算法的数据隐私保护系统在审
申请号: | 202011004265.0 | 申请日: | 2020-09-22 |
公开(公告)号: | CN112182649A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 魏立斐;张蕾;李梦思;陈聪聪 | 申请(专利权)人: | 上海海洋大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;H04L9/00;H04L9/08;H04L29/06 |
代理公司: | 上海申浩律师事务所 31280 | 代理人: | 张洁 |
地址: | 201306 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 安全 计算 线性 回归 算法 数据 隐私 保护 系统 | ||
本发明公开了一种基于安全两方计算的线性回归算法,所述方法包括以下步骤:步骤S1:采用秘密共享值的乘法;步骤S2:训练数据预处理;步骤S3:参数初始化;S4:模型参数更新;步骤S5:预测数据预处理;步骤S6:计算预测共享值;步骤S7:重构预测结果。本文方案在保证数据和模型参数隐私不被泄露的同时,所需要的通信开销更低。本申请将原始训练数据和模型参数私有化,在云服务器无法获得原始训练数据以及中间参数、并且无法推断模型参数的情况下,借助云服务的便利实现了一种保护数据隐私的线性回归算法;在此基础上,可安全地执行回归预测任务,在利用云服务器的计算及存储资源时,可高效准确的进行线性回归模型的训练及数据预测。
技术领域
本发明涉及信息安全技术私领域,具体涉及一种基于安全两方计算线性回归算法的数据隐私保护系统。
背景技术
线性回归(Linear Regression)是一种以线性模型来建模一个或多个自变量与因变量关系的方法,其核心思想是将一系列的影响因素和结果进行拟合,从而勾画出因变量与自变量之间的相关关系。作为一种经典的算法,目前广泛应用于统计分析及机器学习领域。为了刻画最优的线性回归模型,往往需要由不同的数据提供方提供大量的原始数据发送给云服务器进行集中训练,但云服务器往往是不可信甚至恶意的,所以研究如何在不泄露用户数据隐私的情况下利用云服务安全高效的处理回归任务是有意义的。
目前有学者关于回归任务数据隐私保护问题,提出使用同态加密来实现的方案。同态加密允许人们对密文进行特定形式的代数运算得到仍然是加密的结果,将其解密所得到的结果与对明文进行同样的运算结果一样,这满足训练回归模型中的数据隐私保护要求。这种方案不需要大量交互,但计算开销很大。首先使用同态加密算法对数据进行同态加密,然后进行模型训练,最后对结果进行同态解密即可完成训练任务,可以同时实现原始数据和模型参数的隐私保护。现在大多数同态加密算法效率不高,因此使用同态加密方案解决数据的隐私性保护问题实用性不强。
另外,也有一些学者提出通过安全多方计算的方式来实现安全的线性回归任务。这种方案的主要特点是计算廉价。利用两方甚至多方之间的大量交互取代昂贵的计算开销,同时还可以满足原始数据和模型参数的隐私保护要求。因此,使用安全多方计算来解决数据的隐私保护问题是目前研究的主流方向之一。由于当前应用于机器学习的安全多方计算方案需要借助其他的一些密码学技术(比如不经意传输协议、同态加密等),故它的主要挑战是如何通过多方构建一个安全且效率较高的计算协议。
2011年,Hall等人基于同态加密首次提出了一种可以达到安全性定义的安全两方计算线性回归协议,但过于依赖计算开销巨大的同态加密,该方案无法应用到数据条目庞大的数据集中。Martine等人基于文献在数据集分布于多个参与方的情境下,提出了一种能够保护数据隐私的线性回归方案,各计算方可以在不共享自己私有数据集的情况下协同训练线性回归模型。Dankar通过引入一个半可信第三方,在理论上提出了一种支持多个数据提供者参与的隐私保护线性回归方案。Adrià等人提出一种用于任意分布于多个参与方的训练集的隐私保护线性回归方案,该方案结合了Yao的混淆电路和全同态加密方案。之后,Mohassel等人提出的SecureML方案基于混淆电路和不经意传输(Oblivious Transfer,OT)协议设计了支持安全两方计算的随机梯度下降算法,实现了线性回归、逻辑回归以及神经网络的模型训练任务,该方案由数据拥有者将私有数据通过秘密共享的方式分发给两个服务器,由两个服务器用安全多方计算的方式训练模型,实现了加法和乘法的分布式计算。在SecureML的基础上,唐等人借助基于OT协议生成的乘法三元组,提出了具有隐私性的回归模型训练算法,同时实现了对训练数据及模型参数的隐私保护。Akavia等人提出一种能够从多个数据所有者提供的数据集中学习线性回归模型的数据隐私保护方案,该方案使用两个非共谋服务器和线性同态加密(Linearly Homomorphic Encryption)来学习正则化线性回归模型。Dong等人提出了一个可以适应半诚实和恶意环境下的分布式机器学习框架,每个参与者将自己的梯度分成共享份额,并分配给多个参数服务器,由参数服务器聚合梯度后发还给参与者,参与者在本地更新参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海洋大学,未经上海海洋大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011004265.0/2.html,转载请声明来源钻瓜专利网。