[发明专利]一种基于信息熵加权的局部离群检测方法在审
申请号: | 201910540443.2 | 申请日: | 2019-06-21 |
公开(公告)号: | CN110288014A | 公开(公告)日: | 2019-09-27 |
发明(设计)人: | 王丽娜;冯超;邢梓萌;沈朝瑶 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/2458 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 康燕文 |
地址: | 210044 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于信息熵加权的局部离群检测方法,首先,预先获取属性为离群属性的样本数据,并设置离群属性权值;其次求出熵权距离;根据熵权距离找出每个样本数据距离最近的k个数据;然后,计算每个样本数据的k近邻距离dr和平均距离Dr;最后计算每个样本数据的局部离群因子eldof(r)。本发明在LDOF算法的基础上增加了熵权信息,即在计算距离时采用熵的加权距离,使得离群数据检测的准确率提高,同时产生一定的时间开销,在检测时不需事先了解数据分布,不依赖达到一定数量和要求的训练集等,有效提高了算法检测精度。 | ||
搜索关键词: | 样本数据 检测 信息熵 加权 计算距离 加权距离 距离最近 离群数据 平均距离 时间开销 数据分布 算法检测 预先获取 权信息 训练集 准确率 算法 | ||
【主权项】:
1.一种基于信息熵加权的局部离群检测方法,其特征在于,包括以下步骤:(1)预先获取属性为离群属性的样本数据,并设置离群属性权值;(2)求出熵权距离;(3)根据熵权距离找出每个样本数据距离最近的k个数据;(4)计算每个样本数据的k近邻距离dr和平均距离Dr;(5)计算每个样本数据的局部离群因子eldof(r)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910540443.2/,转载请声明来源钻瓜专利网。