[发明专利]基于深度无监督自动编码器的图异常检测方法在审
申请号: | 202210281370.1 | 申请日: | 2022-03-22 |
公开(公告)号: | CN114638342A | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 席亮;梁晨晨;梁钰佳 | 申请(专利权)人: | 哈尔滨理工大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150080 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 监督 自动 编码器 异常 检测 方法 | ||
1.基于深度无监督自动编码器的图异常检测方法,其特征在于,该方法包括以下步骤:
步骤1:模型预处理,包括对数据集的划分和对原始数据的预处理。
步骤2:模型训练和优化,使用基于深度无监督自动编码器的图异常检测方法进行训练。
步骤3:模型测试,使用训练好的模型对测试集的数据测试,计算测试数据的异常分数。
2.根据权利要求1所述的基于深度无监督自动编码器的图异常检测方法,其特征在于,所述步骤1中的模型预处理模块的具体步骤为:
步骤1_1加载原始数据集中的图节点文件和图边文件。
步骤1_2将原始数据集按不同的比例划分成训练集和测试集。分别取数据集中的10%、20%、30%、40%和50%的数据作为训练集训练,剩余数据作为测试集进行测试使用。
步骤1_3计算转移矩阵。通过网络的邻接矩阵A得到转移矩阵D-1A,其中D是对角矩阵。
步骤1_4计算节点之间的高阶近似。表示概率矩阵,取所有概率矩阵P1,…,PT的平均值来获取节点之间的高阶近似。
步骤1_5计算模型的最终输入。最终使用矩阵的行作为模型的最终输入。
3.根据权利要求1所述的基于深度无监督自动编码器的图异常检测方法,其特征在于,所述步骤2中的模型训练和优化模块的具体步骤为:
步骤2_1计算邻近节点的结构损失使用结构自动编码器的输入捕获节点的局部邻域,进而通过最小化重构损失保持网络中的高阶邻近性。
步骤2_2计算邻近节点的结构同质性损失由于网络中的离群节点随机地与多个社区的节点连接,因此通过减小它们对同质性损失的贡献来优化网络。
步骤2_3计算邻近节点的属性损失与节点的结构损失类似。
步骤2_4计算邻近节点的属性同质性损失与节点的结构同质性损失类似。
步骤2_5计算结构和属性联合损失
步骤2_6通过最小化总损失来训练整个模型的网络,其中α为权重系数。具体公式如下:
步骤2_7使用ADAM函数来优化学习自动编码器的参数,直至收敛,计算得到节点的最终嵌入。具体来讲,对于每次迭代更新,从每个节点的邻域随机抽取2个节点并取它们的平均值来近似整个邻域的平均。对于训练,首先对自动编码器进行不带异常值的训练,然后交替更新各自封闭规则的超参数,然后使用ADAM函数更新自动编码器的参数,直到其收敛。最终将节点的结构和属性的嵌入拼接起来,得到节点的最终嵌入。
步骤2_8根据训练集的准确率和F1分数对模型超参数进行调整,直到得到最优的符合预期的结果。
4.根据权利要求1所述的基于深度无监督自动编码器的图异常检测方法,其特征在于,所述步骤3中的模型测试模块的具体步骤为:
步骤3_1加载原始数据集中的图节点文件和图边文件。
步骤3_2对测试数据进行预处理,与训练数据的预处理方式一致。
步骤3_3将经过预处理的测试数据输入训练好的模型中,计算节点的结构异常分数属性异常分数和结构属性联合异常的分数,将三部分的异常分数的加权平均值oi作为最终的异常分数。
步骤3_4计算测试数据的F1分数和准确率,根据结果调整模型的超参数,最终得到一个最优且符合预期的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210281370.1/1.html,转载请声明来源钻瓜专利网。