[发明专利]离群点检测方法和装置在审
申请号: | 201710494778.6 | 申请日: | 2017-06-26 |
公开(公告)号: | CN107357844A | 公开(公告)日: | 2017-11-17 |
发明(设计)人: | 徐骄 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州华进联合专利商标代理有限公司44224 | 代理人: | 刘艳丽 |
地址: | 510530 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种离群点检测方法和装置。该方法获得距离所选样本点最近的预设数目的样本点,根据获得样本点与所选样本点的平均距离自动计算出密度区域的半径,根据获得样本点与所选样本点的距离权重以及设定值自动计算出密度阈值,然后根据该半径和密度阈值对样本空间中的样本点进行密度聚类,筛选出离群点。本发明由于不需要事先人为指定密度区域的半径和密度阈值,因此有效避免了人工指定所引起的偏差,提高了离群点检测的准确性。 | ||
搜索关键词: | 离群 检测 方法 装置 | ||
【主权项】:
一种离群点检测方法,其特征在于,包括步骤:获取待检测的样本空间,其中所述样本空间包括多个样本点,每个样本点包括若干个维度;从所述样本空间选取一个未处理的样本点作为第一样本点;计算所述样本空间中其它未处理的每个样本点与所述第一样本点之间的距离权重,其中所述距离权重为样本点和第一样本点的值相同的维度数与总维度数之比;根据所述距离权重计算其它未处理的每个样本点与所述第一样本点之间的距离,根据所述距离获得距离所述第一样本点最近的预设数目的第二样本点;根据各个第二样本点与所述第一样本点之间距离的平均值,获得密度区域的半径;根据各个第二样本点与所述第一样本点之间的距离权重以及所述预设数目,获得密度阈值;根据所述密度区域的半径和所述密度阈值确定所述第一样本点的标识,其中所述标识用于描述进行密度聚类时所述第一样本点的类特征;返回执行从所述样本空间选取一个未处理的样本点作为第一样本点的步骤,直到所述样本空间中所有样本点均被处理;根据所述标识对所述样本空间中所有的样本点进行类别划分,将不属于任何类别的样本点判定为离群点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710494778.6/,转载请声明来源钻瓜专利网。