[发明专利]联邦学习分类树构建方法、模型构建方法,及终端设备在审

专利信息
申请号: 202010608724.X 申请日: 2020-06-29
公开(公告)号: CN111783139A 公开(公告)日: 2020-10-16
发明(设计)人: 周帅;陈忠;张一凡;王虎;黄志翔;彭南博;程建波 申请(专利权)人: 京东数字科技控股有限公司
主分类号: G06F21/62 分类号: G06F21/62;G06K9/62;G06N20/20
代理公司: 北京华夏泰和知识产权代理有限公司 11662 代理人: 卢万腾;曾军
地址: 100176 北京市大兴区北京经*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 联邦 学习 分类 构建 方法 模型 终端设备
【说明书】:

发明实施例涉及一种联邦学习分类树构建方法、模型构建方法,及终端设备,包括:根据第一分类特征和第一分类阈值,将用户样本集合进行分类,获取至少两组用户样本子集;向第一子集中添加混淆用户样本,获取第二子集;计算与第二子集对应的第一加密梯度值之和;对一次加密梯度值进行二次加密后,与第二子集共同发送至第二数据提供方;接收第二加密梯度值之和;对第二加密梯度值之和进行一次解密,与第一加密梯度值之和、第一分类特征的信息以及第一分类阈值的信息反馈至第二数据提供方;接收最优分类特征的信息和与最优分类特征对应的最优分类阈值的信息;根据二者对第一子集进行分类,形成联邦学习分类树的分支节点,构建联邦学习分类树。

技术领域

本发明实施例涉及计算机技术领域,尤其涉及联邦学习分类树构建方法、模型构建方法,及终端设备。

背景技术

随着机器学习技术的发展,越来越多的机器学习方法在金融、医疗等领域中得到了广泛的应用。在机器学习中,数据决定了模型效果的上限,为了进一步提高模型的准确性,聚合多方数据进行模型训练的联邦学习方法开始出现。

由于不同的公司可能掌握着同一批用户不同维度的特征,将不同的特征聚合起来,可以有效地提高机器学习的效果。纵向联邦学习的目标正是聚合多方不同维度的特征数据,在不泄露用户隐私的前提下,共享各方数据,协同训练模型。目前比较成熟的纵向联邦学习方案是FATE开源框架中的SecureBoost方案,该方案是对XGBoost模型的一种联邦训练方法。为了避免用户隐私泄露,SecureBoost方案中,数据提供方会将特征名称隐藏,使用特征的编号代替特征名称,防止业务方根据特征名称和背景知识对数据提供方的特征进行分析。

也正是由于数据提供方的特征名称都被隐藏处理,使得最终XGBoost模型的可解释性受到了极大的影响。模型的可解释性在金融领域有着重要意义。如果模型缺乏可解释性,我们便无法直觉地判断模型是否抓住了有意义的特征,也无法得知模型在其他样本预测上的泛化能力如何,因此可能会使得模型预测结果受到质疑。

发明内容

鉴于此,为解决现有技术中上述技术问题,本发明实施例提供联邦学习分类树构建方法、模型构建方法,及终端设备。

第一方面,本发明实施例提供一种联邦学习分类树构建方法,该方法由第一数据提供方执行,包括:

根据第一分类特征和与第一分类特征对应的第一分类阈值,将当前的用户样本集合进行分类后,获取至少两组用户样本子集;

按照预设规则向第一子集中添加混淆用户样本,获取经过混淆后的第二子集,其中第一子集为至少两组用户样本子集中的任一个子集;

根据预获取的与第二子集中每一个用户样本对应的一次加密梯度值,计算第一加密梯度值之和;

对第二子集中每一个用户样本分别对应的一次加密梯度值进行二次加密后,与第二子集共同发送至第二数据提供方;

接收第二数据提供方反馈的第二加密梯度值之和,第二加密梯度值之和为第二数据提供方根据第二分类特征、与第二分类特征对应的第二分类阈值、第二子集以及第二子集中每一个用户样本分别对应的二次加密梯度值计算得到并进行加密的梯度值之和;

对第二加密梯度值之和进行一次解密后,与第一加密梯度值之和、第一分类特征的信息以及第一分类阈值的信息共同反馈至第二数据提供方;

接收第二数据提供方反馈的最优分类特征的信息和与最优分类特征对应的最优分类阈值的信息,其中,最优分类特征的信息和最优分类阈值的信息为第二数据提供方根据第一加密梯度值之和,以及第二加密梯度值之和,确定的信息;

根据最优分类特征信息和最优分类阈值的信息,对第一子集进行分类,形成联邦学习分类树的分支节点;

直至达到预设分类要求时,根据所有分支节点,构建联邦学习分类树。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股有限公司,未经京东数字科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010608724.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top