[发明专利]纵向联邦决策树训练方法及装置在审
| 申请号: | 202210796857.3 | 申请日: | 2022-07-08 |
| 公开(公告)号: | CN114861841A | 公开(公告)日: | 2022-08-05 |
| 发明(设计)人: | 李陆沁;裴阳 | 申请(专利权)人: | 蓝象智联(杭州)科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;H04L9/40;G06F21/60 |
| 代理公司: | 北京知果之信知识产权代理有限公司 11541 | 代理人: | 苏利 |
| 地址: | 311121 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 纵向 联邦 决策树 训练 方法 装置 | ||
1.一种纵向联邦决策树训练方法,其特征在于,包括:
对训练发起方的具有的训练样本的第一特征及训练参与方具有的训练样本的第二特征进行等宽分箱,获得训练发起方的第一离散特征和训练参与方的第二离散特征,其中,所述训练发起方具有所述训练样本的标签;
对决策树的当前节点,所述训练发起方根据所述训练样本的标签及所述第一离散特征,获得第一基尼系数;
所述训练发起方将所述标签加密传输至所述训练参与方;
所述训练参与方根据所述等宽分箱的分箱节点,获得所述训练样本的第一分类结果,并加密发送至训练发起方;
根据加密状态的标签和加密状态的第一分类结果,由训练发起方获得第二基尼系数,并由训练参与方获得第三基尼系数;
根据所述第一基尼系数、所述第二基尼系数和所述第三基尼系数,确定决策树的当前节点的切分点;
根据所述决策树的各节点的切分点,对决策树进行训练,获得训练后的决策树。
2.根据权利要求1所述的方法,其特征在于,根据加密状态的标签和加密状态的第一分类结果,所述由训练发起方获得第二基尼系数,包括:
根据加密状态的标签和加密状态的第一分类结果,确定训练发起方的各第一离散特征的特征值的第二基尼系数。
3.根据权利要求2所述的方法,其特征在于,确定训练发起方的各第一离散特征的特征值的第二基尼系数,包括:
根据公式确定以第一离散特征的特征值作为分类的切分点的第二基尼系数,其中,,为第i个训练样本,,为加密状态的标签,为加密状态的第一分类结果,表示根据第一分类结果确定的训练样本的第一个类别,表示第一个类别的样本数量,表示根据第一分类结果确定的训练样本的第二个类别,,表示第二个类别的样本数量,表示训练样本集合。
4.根据权利要求1所述的方法,其特征在于,根据加密状态的标签和加密状态的第一分类结果,由训练参与方获得第三基尼系数,包括:
根据加密状态的标签和加密状态的第一分类结果,确定训练参与方的各第二离散特征的特征值的第三基尼系数。
5.根据权利要求1所述的方法,其特征在于,根据所述第一基尼系数、所述第二基尼系数和所述第三基尼系数,确定决策树的当前节点的切分点,包括:
对所述第二基尼系数进行解密,获得解密后的第二基尼系数,并对所述第三基尼系数进行解密,获得解密后的第三基尼系数;
确定所述第一基尼系数、所述解密后的第二基尼系数和所述解密后的第三基尼系数中的最小值;
将所述最小值对应的特征的特征值,作为所述当前节点的切分点。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
在所述最小值小于基尼系数阈值的情况下,停止当前节点的训练。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述训练样本的数量小于数量阈值的情况下,停止当前节点的训练。
8.一种纵向联邦决策树训练装置,其特征在于,包括:
分箱模块,用于对训练发起方的具有的训练样本的第一特征及训练参与方具有的训练样本的第二特征进行等宽分箱,获得训练发起方的第一离散特征和训练参与方的第二离散特征,其中,所述训练发起方具有所述训练样本的标签;
第一系数模块,用于对决策树的当前节点,所述训练发起方根据所述训练样本的标签及所述第一离散特征,获得第一基尼系数;
传输模块,用于所述训练发起方将所述标签加密传输至所述训练参与方;
分类模块,用于所述训练参与方根据所述等宽分箱的分箱节点,获得所述训练样本的第一分类结果,并加密发送至训练发起方;
系数获得模块,用于根据加密状态的标签和加密状态的第一分类结果,由训练发起方获得第二基尼系数,并由训练参与方获得第三基尼系数;
切分点模块,用于根据所述第一基尼系数、所述第二基尼系数和所述第三基尼系数,确定决策树的当前节点的切分点;
训练模块,用于根据所述决策树的各节点的切分点,对决策树进行训练,获得训练后的决策树。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于蓝象智联(杭州)科技有限公司,未经蓝象智联(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210796857.3/1.html,转载请声明来源钻瓜专利网。





