[发明专利]在可信执行环境中训练GBDT模型的方法、装置及设备有效
申请号: | 201911151159.2 | 申请日: | 2019-11-21 |
公开(公告)号: | CN110990829B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 赵原;殷山 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F21/53 | 分类号: | G06F21/53;G06N5/00;G06N20/00 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 张明;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 可信 执行 环境 训练 gbdt 模型 方法 装置 设备 | ||
1.一种在可信执行环境中训练GBDT模型的方法,所述GBDT模型包括多棵决策树,每棵决策树中的各个节点具有对应的节点编号;所述方法基于N个具有D维特征的样本进行,所述D维特征中每项特征对应于N个样本的N个特征值以加密的形式保存在非可信区域中;所述方法包括:
将所述D维特征中的每项特征依次作为当前特征,基于当前特征对当前决策树中的当前节点进行节点分割判断,所述节点分割判断包括:
将当前特征的加密的N个特征值从所述非可信区域加载到所述可信执行环境中,在所述可信执行环境中对其进行解密,得到当前特征的N个特征值;
将当前特征的N个特征值依次作为当前特征值,基于保存在所述可信执行环境中的第一数组,判断当前特征值对应的当前样本是否落入当前节点对应的样本集中;所述第一数组包括对应于所述N个样本的N个元素,每个元素用于表示对应样本当前落入对应样本集的节点的节点编号;
若是,则基于当前特征以及当前特征值,对当前节点对应的样本集进行假定分割;基于假定分割结果,确定当前节点的当前最佳分裂特征和当前最佳特征阈值;
在基于所述D维特征中每项特征进行所述节点分割判断之后,将所述当前节点对应的当前最佳分裂特征和当前最佳特征阈值作为其分裂特征和特征阈值,对当前节点对应的样本集进行分割,生成当前节点对应的子节点;
基于所述子节点的节点编号,对所述第一数组进行更新;
基于更新后的第一数组,对下一节点进行所述节点分割判断,直至到达叶子节点。
2.根据权利要求1所述的方法,所述N个元素中各个元素各自对应的样本的样本编号与各自的数组下标相对应。
3.根据权利要求2所述的方法,所述基于保存在所述可信执行环境中的第一数组,判断当前特征值对应的当前样本是否落入当前节点对应的样本集中,包括:
确定当前样本的样本编号对应的数组下标;
基于确定的数组下标,在所述第一数组的N个元素中查找对应的元素;
若查找的元素的元素值与当前节点的节点编号相等,则确定当前特征值对应的当前样本落入当前节点对应的样本集中;否则,确定当前特征值对应的当前样本未落入当前节点对应的样本集中。
4.根据权利要求2所述的方法,所述当前节点的子节点包括左子节点和右子节点;
在所述基于所述子节点的节点编号,对所述第一数组进行更新之前,还包括:
基于所述当前节点的节点编号以及第一函数,确定所述左子节点的节点编号;所述第一函数的常数项为奇数;
基于所述当前节点的节点编号以及第二函数,确定所述右子节点的节点编号;所述第二函数的常数项为偶数;
所述基于所述子节点的节点编号,对所述第一数组进行更新,包括:
基于所述左子节点的节点编号和所述右子节点的节点编号,对所述第一数组进行更新。
5.根据权利要求4所述的方法,所述基于所述左子节点的节点编号和所述右子节点的节点编号,对所述第一数组进行更新,包括:
对于所述样本集中被分割到所述左子节点的第一样本编号,确定对应的第一下标;将所述第一数组的N个元素中对应于所述第一下标的元素替换为所述左子节点的节点编号;以及
对于所述样本集中被分割到所述右子节点的第二样本编号,确定对应的第二下标;将所述第一数组的N个元素中对应于所述第二下标的元素替换为所述右子节点的节点编号。
6.根据权利要求2所述的方法,还包括:
对于当前决策树的每个叶子节点,基于所述叶子节点的节点编号,从所述第一数组的N个元素中确定出目标元素,所述目标元素的元素值等于所述叶子节点的节点编号;
基于所述目标元素的数组下标,确定落入所述叶子节点对应的样本集中的样本编号;
基于确定的样本编号对应的样本的标签值以及残差,计算所述叶子节点的目标值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911151159.2/1.html,转载请声明来源钻瓜专利网。