[发明专利]用于生成隔离森林的方法和装置有效
申请号: | 201910930586.4 | 申请日: | 2019-09-29 |
公开(公告)号: | CN110705635B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 韩旭东;刘洋;张钧波;张文夕;郑宇 | 申请(专利权)人: | 京东城市(北京)数字科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F21/55 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100086 北京市海淀区知*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 生成 隔离 森林 方法 装置 | ||
本公开的实施例公开了用于生成隔离森林的方法和装置。该方法的一具体实施方式包括:基于至少两个目标数据端预先存储的目标数量个样本数据组,重复执行以下建树步骤,获得目标数量个目标树:建立目标树的根节点作为当前节点;从特征集合中选取目标特征;获取目标特征的目标特征值;执行以下分裂步骤:将目标特征和目标特征值发送给目标数据端;获取目标数据端发送的左数据信息和右数据信息;基于左数据信息和右数据信息建立左子节点和右子节点;响应于最新获得的子节点满足停止分裂条件,将该子节点确定为叶子节点;响应于最新获得的子节点均为叶子节点,获得目标树;将所获得的目标树组合成隔离森林。该实施方式提高了隔离森林的泛化能力。
技术领域
本公开的实施例涉及计算机技术领域,尤其涉及用于生成隔离森林的方法、装置和用于检测异常数据的方法和装置。
背景技术
异常检测(Anomaly detection)的假设是入侵者活动异常于正常主体的活动。根据这一理念建立主体正常活动的“活动简档”,将当前主体的活动状况与“活动简档”相比较,当违反其统计规律时,认为该活动可能是“入侵”行为。异常检测广泛应用于信用卡、电信反欺诈和网络入侵检测等领域。
隔离森林是一种无监督异常检测算法。目前,用于进行异常检测隔离森林一般基于模型训练设备本地独有的数据训练获得。
发明内容
本公开的实施例提出了用于生成隔离森林的方法、装置和用于检测异常数据的方法、装置。
第一方面,本公开的实施例提供了一种用于生成隔离森林的方法,该方法包括:基于至少两个目标数据端预先存储的目标数量个样本数据组,重复执行以下建树步骤,获得目标数量个目标树:建立目标树的根节点作为当前节点;从预设的特征集合中选取目标特征;获取目标特征的特征值作为目标特征值;基于目标特征、目标特征值和当前节点,执行以下分裂步骤:将目标特征和目标特征值发送给至少两个目标数据端;获取目标数据端发送的左数据信息和右数据信息,其中,左数据信息和右数据信息分别用于指示左数据和右数据,左数据和右数据为目标数据端基于接收的目标特征和目标特征值,对当前节点对应的样本数据进行划分所获得的数据;分别基于所获取的左数据信息和右数据信息建立以当前节点为父节点的左子节点和右子节点;响应于最新获得的子节点满足预设的停止分裂条件,将该子节点确定为叶子节点;响应于最新获得的子节点均为叶子节点,获得目标树;将所获得的目标数量个目标树组合成隔离森林。
在一些实施例中,建树步骤还包括:响应于最新获得的子节点包括不是叶子节点的子节点,将该子节点确定为当前节点,基于最新的当前节点,继续执行分裂步骤。
在一些实施例中,基于最新的当前节点,继续执行分裂步骤包括:确定最新的当前节点是否满足预设的特征用尽条件,其中,特征用尽条件包括:节点对应至少两个样本数据且所对应的至少两个样本数据对应的目标特征的特征值相同;响应于满足特征用尽条件,从特征集合中选取未被选取过的特征作为新的目标特征,获取新的目标特征的特征值作为新的目标特征值,基于最新的目标特征、目标特征值和当前节点,继续执行分裂步骤;响应于不满足特征用尽条件,基于最新的当前节点对应的样本数据对应的目标特征的特征值,生成新的目标特征值,基于目标特征、最新的目标特征值和当前节点,继续执行分裂步骤。
在一些实施例中,停止分裂条件包括以下至少一项:节点对应的深度大于或等于预设深度;节点对应的样本数据的数量为1;节点满足特征用尽条件,且特征集合中不包括未被选取过的特征。
在一些实施例中,左数据信息为用于指示左数据中不重复的左数据的信息,右数据信息为用于指示右数据中不重复的右数据的信息。
在一些实施例中,获取目标数据端发送的左数据信息和右数据信息包括:接收目标数据端发送的左数据加密信息和右数据加密信息,其中,左数据加密信息为目标数据端对左数据信息进行加密后获得的信息,右数据加密信息为目标数据端对右数据信息进行加密后获得的信息;分别对接收到的左数据加密信息和右数据加密信息进行解密,获得左数据信息和右数据信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东城市(北京)数字科技有限公司,未经京东城市(北京)数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910930586.4/2.html,转载请声明来源钻瓜专利网。