[发明专利]基于孤立森林二分类异常点检测方法、信息数据处理终端在审
申请号: | 201910309830.5 | 申请日: | 2019-04-17 |
公开(公告)号: | CN110046665A | 公开(公告)日: | 2019-07-23 |
发明(设计)人: | 李孝杰;李俊良;史沧红;吕建成;吴锡;周激流;刘书樵;张宪 | 申请(专利权)人: | 成都信息工程大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京元本知识产权代理事务所 11308 | 代理人: | 王红霞 |
地址: | 610225 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于通信控制及通信处理技术领域,公开了一种基于孤立森林二分类异常点检测方法、信息数据处理终端;将原始数据集进行初始的静态平均分块,计算块内密度和均值密度;计算出静态分块的各块内密度后,以原数据集的均值密度作为阈值将数据集进行精简;利用节点的递归方法构建孤立森林;对原始数据集进行相应特征的提取并数据化,计算聚类中心点与其他点的空间位置距离;将由基于密度和距离算出的异常分数及由基于特证信息计算出来的异常分数相加与相对应的阈值进行比较。本发明有效提高异常点检测算法的准确率,能大幅度减少异常检测过程中的实际数据量,节省计算资源,并且提高了异常检测效率;增强了异常检测算法的鲁棒性。 | ||
搜索关键词: | 异常点检测 信息数据处理 原始数据集 异常分数 二分类 孤立 分块 森林 终端 空间位置距离 异常检测过程 异常检测算法 计算资源 聚类中心 实际数据 通信处理 通信控制 信息计算 异常检测 计算块 鲁棒性 数据化 数据集 原数据 准确率 递归 构建 算法 特证 相加 | ||
【主权项】:
1.一种基于孤立森林二分类异常点检测方法,其特征在于,所述基于孤立森林二分类异常点检测方法包括以下步骤:第一步,将原始数据集进行初始的静态平均分块,然后计算块内密度和均值密度;第二步,计算出静态分块的各块内密度后,以原数据集的均值密度作为阈值将数据集进行精简;第三步,利用节点的递归方法构建孤立森林;(1)从训练数据中随机选择Ψ个点样本点作为subsample,放入树的根节点;(2)随机指定一个维度,在当前节点数据中随机产生一个切割点p——切割点产生于当前节点数据中指定维度的最大值和最小值之间;(3)以此切割点生成了一个超平面,将当前节点数据空间划分为2个子空间:把指定维度里小于p的数据放在当前节点的左孩子,把大于等于p的数据放在当前节点的右孩子;(4)在孩子节点中递归,不断构造新的孩子节点,直到孩子节点中只有一个数据或孩子节点已到达限定高度;第四步,对原始数据集进行相应特征的提取并数据化,计算聚类中心点与其他点的空间位置距离;第五步,将由基于密度和距离算出的异常分数及由基于特证信息计算出来的异常分数相加,与相对应的阈值进行比较。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都信息工程大学,未经成都信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910309830.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种油田安全突出问题检测方法
- 下一篇:海量图片标注方法