[发明专利]一种隐私保护的联邦学习方法、装置、电子设备及介质在审
申请号: | 202310308064.7 | 申请日: | 2023-03-27 |
公开(公告)号: | CN116432772A | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 周一竞;黄翠婷 | 申请(专利权)人: | 杭州博盾习言科技有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F21/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 311121 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 隐私 保护 联邦 学习方法 装置 电子设备 介质 | ||
本申请提供了一种隐私保护的联邦学习方法、装置、电子设备及计算机可读存储介质,获取第一参与方的第一样本序列与第二参与方的第二样本序列之间的交集样本标识,以及交集样本标识对应的第二样本在第二样本序列中的位置信息;按照位置信息排列交集样本标识对应的第一样本,得到交集样本序列;在交集样本序列中添加空样本,得到扩充样本序列;基于扩充样本序列中位于目标位置处的样本产生的第一模型输出结果,对第一参与方的第一模型进行训练。可以在隐匿交集样本标识的情况下使各个参与方之间的样本数据完成对齐,从而可以在不告知第二参与方交集样本标识的情况下完成联邦学习,提高了联邦学习过程中的信息安全性。
技术领域
本申请涉及机器学习技术领域,尤其涉及一种隐私保护的联邦学习方法、装置、电子设备及计算机可读存储介质。
背景技术
随着机器学习技术的快速发展,机器学习的应用逐渐渗透于各个领域。联邦学习(federated learning)是一种分布式机器学习技术,允许多个参与方在保护数据隐私的前提下协同对模型进行训练。
相关技术中,进行联邦学习时需要先对所有参与方持有的样本数据做隐私集合求交,将交集样本标识发送给每个参与方,各个参与方依据交集样本标识对自身持有的样本数据进行处理,生成对齐的样本数据集,所有参与方根据对齐的样本数据集进行联邦学习。
但是,由于所有参与方都知晓交集样本标识,也就知道了自身与其他参与方所持有的样本之间的相似度,从而容易引起信息泄露,降低各参与方在联邦学习过程中的数据安全性。
发明内容
本申请实施例提供一种隐私保护的联邦学习方法、装置、电子设备及计算机可读存储介质,以解决相关技术中联邦学习过程中的各参与方的数据安全性降低的问题。
第一方面,本申请实施例提供了一种隐私保护的联邦学习方法,应用于第一参与方,所述方法包括:
获取第一参与方的第一样本序列与第二参与方的第二样本序列之间的交集样本标识,以及所述交集样本标识对应的第二样本在所述第二样本序列中的位置信息;
按照所述位置信息排列所述交集样本标识对应的第一样本,得到交集样本序列;
在所述交集样本序列中添加空样本,得到扩充样本序列;其中,所述扩充样本序列中的样本与所述第二样本序列中的第二样本具有一一对应关系,所述扩充样本序列中的第一样本在所述扩充样本序列中所处的位置,与所述第一样本具有相同样本标识的第二样本在所述第二样本序列中所处的位置相同;
基于所述扩充样本序列中位于目标位置处的样本产生的第一模型输出结果,以及从所述第二参与方获取的,由所述第二样本序列中所述目标位置处的第二样本产生的第二模型输出结果,对所述第一参与方的第一模型进行训练,得到第一目标模型。
可选地,所述在所述交集样本序列中添加空样本,得到扩充样本序列,包括:
确定所述交集样本标识在所述第二样本序列中的补集样本标识集合;
生成所述补集样本标识集合中各个补集样本标识对应的空样本;
按照所述补集样本标识在所述第二样本序列中的次序,将所述补集样本标识对应的空样本插入所述交集样本序列,得到所述扩充样本序列。
可选地,所述方法还包括:
从所述扩充样本序列中目标位置处的样本中获取第一样本参数;
基于所述第一样本参数和所述第一模型的第一模型参数,确定所述第一模型输出结果。
可选地,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州博盾习言科技有限公司,未经杭州博盾习言科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310308064.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于大数据的整车物流信息智能管理平台
- 下一篇:显示装置、显示设备及载具