[发明专利]一种基于图结构的多源迁移学习方法在审
申请号: | 202010917529.5 | 申请日: | 2020-09-03 |
公开(公告)号: | CN112085085A | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 张伟哲;何慧;方滨兴;杨洪伟;白雅雯 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/901;G06N20/00 |
代理公司: | 黑龙江立超同创知识产权代理有限责任公司 23217 | 代理人: | 杨立超 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 结构 迁移 学习方法 | ||
1.一种基于图结构的多源迁移学习方法,其特征在于,包括,
步骤一、获取多个源域数据集和一个目标域数据集,其中,所述源域数据集包括源域图结构、源域数据节点实体特征和源域标签;所述目标域数据集包括目标域图结构和目标域数据节点实体特征;
步骤二、根据源域标签对源域图结构构建节点T-邻域结构,获得T-邻域结构集合C1;其中,所述T-邻域结构的定义为,对于图结构数据中节点T-邻域结构为从所述节点出发且深度为T所遍历到的所有节点形成的子图结构,所述子图结构包含深度T内所有节点的标签信息。
步骤三、对所述T-邻域结构集合C1进行去重,获得子图集B;
步骤四、学习子图集B,获得通用结构;其中,所述通用结构与具有相同标签的图结构相似度高,与具有不同标签的图结构相似度低;
步骤五、利用所述通用结构和所述T-邻域结构集合C1获得源域节点结构特征;
步骤六、将所述源域节点实体特征和所述源域节点结构特征相结合,获得源域新特征;
步骤七、根据源域数据节点实体特征和目标域数据节点实体特征对目标域标签进行初步预测,获得目标域初步预测标签;
步骤八、根据目标域初步预测标签对目标域图结构构建节点T-邻域结构,获得T-邻域结构集合C2;
步骤九、利用所述通用结构和所述T-邻域结构集合C2获得目标域节点结构特征;
步骤十、将所述目标域节点实体特征和所述目标域节点结构特征相结合,获得目标域新特征;
步骤十一、根据所述源域新特征和所述目标域新特征获得目标域节点标签。
2.根据权利要求1所述一种基于图结构的多源迁移学习方法,其特征在于,步骤四中所述通用结构表示为:
其中,B(k)表示通用结构中元素;ave表示对集合求平均;Y表示标签;Pr(·|·)表示两个图之间的相似度;bi、bj表示子图集B中元素;P(i)、Q(j)表示子图集B中元素在T-邻域结构集合中出现的次数。
3.根据权利要求2所述一种基于图结构的多源迁移学习方法,其特征在于,所述通用结构中两个图之间的相似度Pr的计算公式为:
其中,|b|、|B(k)|分别表示图b或图B(k)中点的个数和边的条数的总和;|mcom(b,B(k))|表示图b和图B(k)的最大公共子图,即图b和图B(k)之间的最大公共部分。
4.根据权利要求3所述一种基于图结构的多源迁移学习方法,其特征在于,所述最大公共子图的求解步骤包括,首先求解得到一个最大公共子图所必含有的子图结构作为最大公共子图;然后以所述最大公共子图为基准,逐渐增加边,生成候选公共子图集合;然后根据规则从所述候选公共子图集合中保留新的公共子图,将保留的新的公共子图作为新的最大公共子图;将上述步骤进行迭代计算,直到候选公共子图集合为空,得到最终的最大公共子图;其中,所述规则是当所述候选公共子图集合中两个图之间只有一条边不同时进行两两组合,产生新的公共子图,且所述新的公共子图满足是两个图的子图,即保留所述新的公共子图。
5.根据权利要求1-4中任一项所述一种基于图结构的多源迁移学习方法,其特征在于,步骤五的具体步骤包括,计算所述T-邻域结构集合C1中每个元素与所述通用结构中每个元素之间的相似度,所述相似度组成的向量即为源域节点结构特征;步骤九的具体步骤包括,计算所述T-邻域结构集合C2中每个元素与所述通用结构中每个元素之间的相似度,所述相似度组成的向量即为目标域节点结构特征。
6.根据权利要求1所述一种基于图结构的多源迁移学习方法,其特征在于,所述源域数据节点实体特征和所述目标域数据节点实体特征属于相同的特征空间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010917529.5/1.html,转载请声明来源钻瓜专利网。