[发明专利]一种基于多种支撑点的度量空间离群检测方法在审
申请号: | 201710695785.2 | 申请日: | 2017-08-15 |
公开(公告)号: | CN107480258A | 公开(公告)日: | 2017-12-15 |
发明(设计)人: | 许红龙;戎海武;何敏藩;文翰;杨勇 | 申请(专利权)人: | 佛山科学技术学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州嘉权专利商标事务所有限公司44205 | 代理人: | 王国标 |
地址: | 528000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多种支撑点的度量空间离群检测方法,包括选择距离函数步骤根据数据集的数据类型,选择距离函数;支撑点选取步骤读取数据集,选取不重复的密集支撑点以及边缘支撑点;建立索引步骤计算所有对象与密集支撑点的距离,进行排序,形成一维索引,计算所有对象与边缘支撑点的距离,记为第二距离,以第一距离和第二距离作为坐标,形成支撑点空间;离群检测步骤将一维索引划分成多个数据块,并对数据块逐块进行离群点检测。本发明通过同时选中密集支撑点和多个边缘支撑点,避免出现单支撑点导致的数据空间扭曲的技术问题,同时降低建立索引时间开销,减少距离计算次数,提高离群检测速度。本发明用于检测数据集中的离群点。 | ||
搜索关键词: | 一种 基于 多种 支撑点 度量 空间 离群 检测 方法 | ||
【主权项】:
一种基于多种支撑点的度量空间离群检测方法,其特征在于,所述方法包括以下步骤:选择距离函数步骤:根据数据集的数据类型,选择相应的距离函数;支撑点选取步骤:读取数据集,在数据集中选取密集支撑点以及边缘支撑点,所述密集支撑点与边缘支撑点不重复;建立索引步骤:分别计算数据集中所有对象与密集支撑点的距离,记为第一距离,按第一距离从大到小顺序排序,形成一维索引,分别计算数据集中所有对象与边缘支撑点的距离,记为第二距离,以第一距离和第二距离作为坐标,形成支撑点空间;离群检测步骤:将所述一维索引划分成多个数据块,并对所述数据块逐块进行离群点检测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710695785.2/,转载请声明来源钻瓜专利网。