[发明专利]一种基于上下文的无监督关系数据异常检测方法在审
申请号: | 201711379664.3 | 申请日: | 2017-12-13 |
公开(公告)号: | CN108038211A | 公开(公告)日: | 2018-05-15 |
发明(设计)人: | 孟凡;葛笑天;王皓;陈烜松;高阳 | 申请(专利权)人: | 南京大学;江苏省审计厅 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 苏州威世朋知识产权代理事务所(普通合伙) 32235 | 代理人: | 杨林洁 |
地址: | 210009 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 上下文 监督 关系 数据 异常 检测 方法 | ||
1.一种基于上下文的无监督关系数据异常检测方法,其特征在于,该方法包括以下步骤:
(1)将多源关系型数据表进行融合和预处理;
(2)根据所得到的关系型属性计算属性值的Intra依赖值;
(3)根据所得到的关系型属性计算属性值的Inter依赖值;
(4)根据步骤(2)和(3)计算所得的Intra依赖值和Inter依赖值,计算属性依赖关系结构;
(5)用一种启发式递归反向淘汰算法计算上下文属性集;
(6)用改进的离散属性距离学习算法,联合上下文属性值和行为属性值,计算基于上下文属性的相似度矩阵;
(7)根据参考样本选择器选择参考样本候选集;
(8)根据选择的参考样本候选集进一步计算参考样本;
(9)根据所计算得到的基于上下文属性的相似度矩阵和参考样本,计算基于上下文关系的数据异常因子序列;
(10)计算关系数据异常候选集,并确定异常数据。
2.根据权利要求1所述一种基于上下文的无监督关系数据异常检测方法,其特征在于,所述步骤(5)中,所述启发式递归反向淘汰算法通过顺序检索策略,迭代去除冗余属性,从而计算出近似最佳属性子集。
3.根据权利要求1所述一种基于上下文的无监督关系数据异常检测方法,其特征在于,所述步骤(6)中,改进的离散属性距离学习算法利用上下文属性值和行为属性值,通过计算条件概率计算所述上下文属性值和行为属性值之间的相似度和距离。
4.根据权利要求1所述一种基于上下文的无监督关系数据异常检测方法,其特征在于,所述步骤(7)中,包括两种算法:随机k样本选择算法和中心k样本选择算法。
5.根据权利要求4所述一种基于上下文的无监督关系数据异常检测方法,其特征在于,所述随机k样本选择算法是指从数据集中随机挑选k个样本,作为参考样本候选集;所述中心k样本选择算法只是通过将数据集聚类成k个簇团,并分别选择距离样本中心最近的k个样本点作为参考样本候选集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学;江苏省审计厅,未经南京大学;江苏省审计厅许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711379664.3/1.html,转载请声明来源钻瓜专利网。