[发明专利]用于生成隔离森林的方法和装置有效
| 申请号: | 201910930586.4 | 申请日: | 2019-09-29 |
| 公开(公告)号: | CN110705635B | 公开(公告)日: | 2020-11-03 |
| 发明(设计)人: | 韩旭东;刘洋;张钧波;张文夕;郑宇 | 申请(专利权)人: | 京东城市(北京)数字科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F21/55 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
| 地址: | 100086 北京市海淀区知*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 生成 隔离 森林 方法 装置 | ||
1.一种用于生成隔离森林的方法,包括:
基于至少两个目标数据端预先存储的目标数量个样本数据组,重复执行以下建树步骤,获得目标数量个目标树:
建立目标树的根节点作为当前节点;从预设的特征集合中选取目标特征;获取目标特征的特征值作为目标特征值;基于目标特征、目标特征值和当前节点,执行以下分裂步骤:将目标特征和目标特征值发送给所述至少两个目标数据端;获取目标数据端发送的左数据信息和右数据信息,其中,左数据信息和右数据信息分别用于指示左数据和右数据,左数据和右数据为目标数据端基于接收的目标特征和目标特征值,对当前节点对应的样本数据进行划分所获得的数据;分别基于所获取的左数据信息和右数据信息建立以当前节点为父节点的左子节点和右子节点,其中,左子节点对应的样本数据为目标数据端发送的左数据信息所指示的样本数据,右子节点对应的样本数据为目标数据端发送的右数据信息所指示的样本数据;响应于最新获得的子节点满足预设的停止分裂条件,将该子节点确定为叶子节点;
响应于最新获得的子节点均为叶子节点,获得目标树;
将所获得的目标数量个目标树组合成隔离森林。
2.根据权利要求1所述的方法,其中,所述建树步骤还包括:响应于最新获得的子节点包括不是叶子节点的子节点,将该子节点确定为当前节点,基于最新的当前节点,继续执行所述分裂步骤。
3.根据权利要求2所述的方法,其中,所述基于最新的当前节点,继续执行所述分裂步骤包括:
确定最新的当前节点是否满足预设的特征用尽条件,其中,特征用尽条件包括:节点对应至少两个样本数据且所对应的至少两个样本数据对应的目标特征的特征值相同;
响应于满足所述特征用尽条件,从所述特征集合中选取未被选取过的特征作为新的目标特征,获取新的目标特征的特征值作为新的目标特征值,基于最新的目标特征、目标特征值和当前节点,继续执行所述分裂步骤;
响应于不满足所述特征用尽条件,基于最新的当前节点对应的样本数据对应的目标特征的特征值,生成新的目标特征值,基于目标特征、最新的目标特征值和当前节点,继续执行所述分裂步骤。
4.根据权利要求1所述的方法,其中,所述停止分裂条件包括以下至少一项:
节点对应的深度大于或等于预设深度;
节点对应的样本数据的数量为1;
节点满足特征用尽条件,且所述特征集合中不包括未被选取过的特征。
5.根据权利要求1所述的方法,其中,左数据信息为用于指示左数据中不重复的左数据的信息,右数据信息为用于指示右数据中不重复的右数据的信息。
6.根据权利要求1所述的方法,其中,所述获取目标数据端发送的左数据信息和右数据信息包括:
接收目标数据端发送的左数据加密信息和右数据加密信息,其中,左数据加密信息为目标数据端对左数据信息进行加密后获得的信息,右数据加密信息为目标数据端对右数据信息进行加密后获得的信息;
分别对接收到的左数据加密信息和右数据加密信息进行解密,获得左数据信息和右数据信息。
7.一种用于检测异常数据的方法,包括:
获取目标数据;
将所述目标数据输入预先训练的隔离森林,获得所述目标数据在所述隔离森林包括的隔离树中的深度,其中,所述隔离森林采用如上述权利要求1-6之一的方法生成;
基于所获得的深度,生成用于指示所述目标数据是否为异常数据的检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东城市(北京)数字科技有限公司,未经京东城市(北京)数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910930586.4/1.html,转载请声明来源钻瓜专利网。





