[发明专利]兼容单边特征与双边特征建模的联邦学习逻辑回归方法在审
申请号: | 202110856538.2 | 申请日: | 2021-07-28 |
公开(公告)号: | CN113570068A | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 杜润萌;祝文伟 | 申请(专利权)人: | 神谱科技(上海)有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 上海诺衣知识产权代理事务所(普通合伙) 31298 | 代理人: | 衣然 |
地址: | 200001 上海市黄浦区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 兼容 单边 特征 双边 建模 联邦 学习 逻辑 回归 方法 | ||
本发明属于机器学习领域,具体公开了一种兼容单边特征与双边特征建模的联邦学习逻辑回归方法,包括步骤:host计算E(WBXB)发送给guest;判断guest是否存在特征值;若guest存在特征值,则guest解密E(WBXB)并计算计算发送给host,Guest计算梯度值LB,LA,加密LB得到E(LB)发送给Host,并且自己本地更新WA;若guest不存在特征值,则guest解密计算发送给host,由Guest计算梯度值LB,加密LB得到E(LB)发送给Host。本发明的方法更具有普适性,没有隐私泄露的风险。
技术领域
本发明涉及机器学习领域,具体为兼容单边特征与双边特征建模的联邦学习逻辑回归方法。
背景技术
机器学习是一类算法的总称,这些算法企图从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类,更具体的说,机器学习可以看作是寻找一个函数,输入是样本数据,输出是期望的结果,只是这个函数过于复杂,以至于不太方便形式化表达。需要注意的是,机器学习的目标是使学到的函数很好地适用于“新样本”,而不仅仅是在训练样本上表现很好。学到的函数适用于新样本的能力,称为泛化(Generalization)能力。
传统机器学习模型直接收集所有的数据进行训练,但是这些数据可能是由单个或多个数据提供者收集的。有很多学者提出利用安全多方计算技术直接对数据加密进行训练,显然这样会带来相当大的计算开销。为了应对这一挑战,谷歌引入了联邦学习(FL)系统。一个全面安全的联邦学习框架,包括横向联邦学习(HFL)、纵向联邦学习(VFL)和联邦转移学习(FTL)。本发明提出的方案主要用于解决纵向联邦学习逻辑回归建模问题。
目前,有很多解决方案用以解决纵向联邦学习逻辑回归建模问题,但是他们提出的方法仅仅适合解决普通情况的建模问题。这里以两方建模为例,如果guest仅仅拥有Y标签,没有特征值信息,host拥有所有特征信息。利用现有方案进行建模的话,最后host可以得到参数信息,这样host就可以直接预测Y标签。因此,针对guest仅仅拥有Y标签的情况,利用现有方案进行建模存在Y标签泄露的风险。
发明内容
本发明的目的在于提供一种兼容单边特征与双边特征建模的联邦学习逻辑回归方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种兼容单边特征与双边特征建模的联邦学习逻辑回归方法,包括步骤:
S1:host计算E(WBXB)发送给guest;
S2:判断guest是否存在特征值;
S3:若guest存在特征值,则guest解密E(WBXB)并计算计算发送给host,Guest计算梯度值LB,LA,加密LB得到E(LB)发送给Host,并且自己本地更新WA;
S4:若guest不存在特征值,则guest解密计算发送给host,由Guest计算梯度值LB,加密LB得到E(LB)发送给Host。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于神谱科技(上海)有限公司,未经神谱科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110856538.2/2.html,转载请声明来源钻瓜专利网。