[发明专利]基于联邦学习的数据处理方法、装置、设备及存储介质有效

专利信息
申请号: 201911158849.0 申请日: 2019-11-22
公开(公告)号: CN110942154B 公开(公告)日: 2021-07-06
发明(设计)人: 黄安埠 申请(专利权)人: 深圳前海微众银行股份有限公司
主分类号: G06N20/00 分类号: G06N20/00
代理公司: 北京同达信恒知识产权代理有限公司 11291 代理人: 彭燕
地址: 518027 广东省深圳市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 联邦 学习 数据处理 方法 装置 设备 存储 介质
【说明书】:

本申请提供一种基于联邦学习的数据处理方法、装置、设备及存储介质,涉及机器学习技术领域,用以解决训练联邦模型时的系统性能较差的问题;该方法包括:至少一个客户端通过本地样本生成器学习本地数据的数据特性,获得训练样本生成器并发送给服务器;服务器将至少一个客户端发送的训练样本生成器进行联邦聚合,得到联邦样本生成器并发送给至少一个客户端;至少一个客户端通过联邦样本生成器生成与其他客户端本地数据的数据特征一致的第一虚拟数据,将自身的本地数据和第一虚拟数据确定为目标数据。该方法中降低训练联邦模型的数据计算量,降低训练联邦模型所消耗的系统资源,提升训练联邦模型时的系统性能以及提升联邦模型的训练效率。

技术领域

本申请涉及机器学习技术领域,尤其涉及一种基于联邦学习的数据处理方法、装置、设备及存储介质。

背景技术

联邦学习架构中的多个客户端在模型训练时不用给出己方数据,而是根据服务器下发的参数加密的全局的联邦模型和客户端本地数据来训练本地模型,并返回本地模型供服务器进行联邦聚合得到全局的联邦模型,更新后的联邦模型重新下发到客户端,循环往复,直到收敛。

但是由于多个客户端的本地数据的数据特征很有可能完全不一致,或者彼此差距较大,导致训练出满足需求的联邦模型需要大量的迭代计算,需要消耗较多的系统资源,导致训练联邦模型时的系统性能较差。

发明内容

本申请提供一种基于联邦学习的数据处理方法、装置、设备及存储介质,以至少降低训练联邦模型的数据计算量,降低训练联邦模型所消耗的系统资源,从而提升训练联邦模型时的系统性能。

本申请第一方面,提供一种联邦学习的数据处理方法,包括:

客户端通过本地样本生成器学习本地数据的数据特性,获得训练样本生成器,并将所述训练样本生成器发送给服务器;

接收服务器发送的联邦样本生成器,所述联邦样本生成器是所述服务器通过联邦聚合所述训练样本生成器以及其他客户端的训练样本生成器得到的;

通过所述联邦样本生成器生成与其他客户端本地数据的数据特征一致的第一虚拟数据,将所述本地数据和所述第一虚拟数据确定为目标数据。

在一种可能的实现方式中,所述将所述本地数据和所述第一虚拟数据确定为目标数据之后,还包括:

将所述目标数据作为输入信息,将训练模型作为输出信息对本地模型进行训练;

将所述训练模型发送给所述服务器,并接收联邦模型,所述联邦模型是所述服务器通过联邦聚合所述训练模型和其他客户端的训练模型得到的。

在一种可能的实现方式中,所述客户端通过本地样本生成器学习本地数据的数据特性,获得训练样本生成器,包括:

通过本地样本生成器生成第二虚拟数据,并通过本地样本判别器判断所述第二虚拟数据的数据特征和所述本地数据的数据特征是否一致;

若不一致,则根据所述第二虚拟数据和所述本地数据,对所述本地样本判别器进行训练,得到训练样本判别器,并通过所述训练样本判别器和所述本地数据对本地样本生成器进行训练,得到所述训练样本生成器。

在一种可能的实现方式中,所述通过所述联邦样本生成器生成第一虚拟数据之前,还包括:

若接收到重新训练生成器通知,则将所述联邦样本生成器作为本地样本生成器,通过本地样本生成器学习本地数据的数据特性,获得新的训练样本生成器,并将重新获得的训练样本生成器发送给所述服务器;所述重新训练生成器通知是所述服务器确定联邦样本生成器生成的第三虚拟数据的数据特征与预设本地数据的数据特征的偏差值大于预设偏差值后发送的,所述预设本地数据包括所述客户端的本地数据和其他客户端的本地数据。

本申请第二方面,提供一种联邦学习的数据处理方法,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911158849.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top