[发明专利]一种基于特征同构共享描述的多源异构离群点检测方法有效

专利信息
申请号: 201811600061.6 申请日: 2018-12-26
公开(公告)号: CN109993198B 公开(公告)日: 2021-06-22
发明(设计)人: 张磊;王树鹏;吴广君 申请(专利权)人: 中国科学院信息工程研究所
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京君尚知识产权代理有限公司 11200 代理人: 余长江
地址: 100093 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 特征 同构 共享 描述 多源异构 离群 检测 方法
【说明书】:

发明提出了一种基于特征同构共享描述的多源异构离群点检测方法,通过在特征同构空间中统一地检测来自异构数据集的离群点,以避免浪费不同来源之间的互补信息,并提高多源离群点的识别率,能够解决在一个一致的特征同构空间中识别所有类型的多源异构离群点的问题。

技术领域

本发明属于信息技术领域,提出了一种基于特征同构共享描述的多源异构离群点检测方法。

背景技术

随着大数据时代的到来,在诸如欺诈检测、网络入侵、临床诊断、客户关系管理和生物数据分析等众多实际应用领域中,人们愈加关注于异常样本的有效检测问题。显然,离群点检测是数据挖掘领域中的一项重要任务,其应用遍布从欺诈检测到公共健康的许多方面。然而,随着大量多源数据在许多真实场景中的出现,离群点检测的任务变得更加具有挑战性,因为传统的单源离群点检测技术已经不再适用于多源异构数据。

在过去的几十年中,研究人员已经提出了许多离群点检测方法,包括单源和多视角离群点检测方法。

·单源离群点检测(Mono-Source Outlier Detection)

近来,一些研究人员已经研究了许多机器学习方法[1-4]来处理单源数据中的离群点检测问题。Knorr等人[1]指出通过识别离群点,便可以在各种实际应用领域中发现意外有价值的知识。此外,他们提出并分析了几种用于发现DB离群点(DB-outliers)的算法。在文献[2]中,Li提出了一种基于描述的方法来计算点的反向不可达性,以评估该观测值被认定为边界点或离群点的程度。K-近邻(k-Nearest Neighbors,kNN)[3]方法将给定数据点到其k个最近邻的距离定义为离群点的判定距离。这个距离越大,就越有可能为离群点。Rahmani和Atia[4]提出了两种随机算法用于两种不同的离群模型,即基于鲁棒主成分分析的稀疏和独立离群点检测模型。

然而,随着大量多源数据在许多真实场景中的出现,离群点检测的任务变得更加具有挑战性,因为传统的单源离群点检测技术已经不再适用于多源异构数据。如图1所示,在单一的语音源中,从马聚类中识别出斑马,即离群点,是异常困难的。然而,根据相对应的图片源的样本分布,可以极其容易的识别出异构离群点。因此,亟待开发出一种有效的针对多源异构数据的离群点检测方法。

·多视角离群点检测(Multi-View Outlier Detection)

为了克服传统的单源方法的缺点,研究人员已经提出几种方法[5-8]致力于识别多源离群点。Zhao和Fu[5]研究了多视角离群点检测问题,同时检测两种不同的异常。Janeja和Palanisamy在文献[6]中提出了一种两步的方法来寻找多个域上的异常点。该技术首先进行单域异常检测,发现每个域中的离群点,然后挖掘域间的关联规则,以发现异常点之间的关系。Li等人[7]提出了一种多视角离群点检测框架,同时从多个视角中检测两种不同类型的离群点。该方法的特点是只能在原始的低层特征空间中检测来自不同视角的离群点。Liu和Lam[8]开发了一种多视图异常检测算法,以在多个数据源中发现潜在的恶意内幕活动。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811600061.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top