[发明专利]一种基于集成学习和多层DropNode传播的节点分类方法在审
申请号: | 202210366187.1 | 申请日: | 2022-04-08 |
公开(公告)号: | CN114611630A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 林琦;于硕;孙克;夏锋 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06F40/216 |
代理公司: | 辽宁鸿文知识产权代理有限公司 21102 | 代理人: | 隋秀文 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 集成 学习 多层 dropnode 传播 节点 分类 方法 | ||
1.一种基于集成学习和多层DropNode传播的节点分类方法,其特征在于,包括如下步骤:
步骤1:获取实验所需要使用的数据集
在分析分类结果的实验过程中,采用的数据集分别为Cora、Citeseer、Pubmed三个引文数据集;
步骤2:针对图数据,执行多层DropNode传播
给定一个图G=(V,E),其中V={V1,V2,…,Vn}是一个顶点集合,E是边集代表着顶点与顶点之间的连接;同时,图G的邻接矩阵A和特征矩阵X也被给出;在标签传播过程中,图G中的节点Vi会被分配一个概率p,以此来实现对每一个节点执行多层DropNode传播的过程;具体来说,就是当前节点的每阶邻居节点传播信息给当前节点时,每一阶邻居节点被删除的概率为p;也就是,当前节点经过多层DropNode传播后,特征矩阵X改变为:其中K为传播步长,代表着当前节点的K阶邻居会传递信息给自己,为对称归一化邻接矩阵,代表每一阶邻居节点的特征矩阵被删除的概率为p;
步骤3:预测,将多层传播获得的矩阵送入一个多层感知机模型进行预测
接下来,多层传播获得的矩阵都会被送入一个多层感知机模型进行预测,得到相应的分类结果,即输出未知标签节点的预测标签:其中Θ是多层感知机模型的参数集合;
步骤4:集成多个模型的分类结果
在整个框架中,多个多层感知机模型去完成分类任务产生多个分类结果;除了第一个多层感知机模型之外,每一个多层感知机模型将会使用前一个多层感知机模型的输出作为知识以获得更准确的分类结果;第i个多层感知机模型与第i-1个多层感知机模型之间的预测的优化目标表示为:其中,distance(·,·)表示两个多层感知机模型之间的距离,优化目标是指最小化第i个多层感知机模型与第i-1个多层感知机模型对同一个没有标签的节点v的预测结果的距离;
步骤5:计算总损失及监督损失和集成学习损失
在整个算法中,损失主要分为模型中的损失和模型之间的损失两部分;模型中的损失为监督损失;n个节点中有m个标记节点,每个epoch的监督损失表示为:其中Y为节点的标签,Zi为第i节点经步骤3的多层感知机模型预测得到的分类结果;模型之间的损失为集成学习损失,表示为:其中N表示一共集成N个模型,j表示第j个模型,i表示第i个节点;总的损失为L=Lsup+λLensem,其中λ为控制监督损失和集成损失平衡的参数;
步骤6:验证模型的鲁棒性
通过随机添加假边的攻击方法对图进行扰动,检验了整个框架的鲁棒性;
步骤7:验证模型的过平滑性
通过扩大传播步长,研究了整体框架对过平滑问题的敏感性。
2.一种基于集成学习和多层DropNode传播的节点分类装置,包括:
数据集获取模块:用于获取实验中所需要的数据集及有限标签;
多层DropNode传播模块:用于对特征矩阵进行信息传播;
预测模块:用于预测并且输出分类结果;
集成模块:用于集成多个模型的分类结果;
计算损失模块:用于计算监督损失和集成损失及总损失;
验证模块:用于验证模型的鲁棒性和过平滑性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210366187.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种胸科手术可排烟电凝钩
- 下一篇:一种任务统一调度的方法、系统及介质