[发明专利]基于结构语义融合的大规模混合图特征学习方法有效
申请号: | 201711169332.2 | 申请日: | 2017-11-17 |
公开(公告)号: | CN107944489B | 公开(公告)日: | 2018-10-16 |
发明(设计)人: | 王建民;龙明盛;裴忠一;黄向东 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/72 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于结构语义融合的大规模混合图特征学习方法,包括:获取训练语义标签信息集Strain,获取节点对集Pe,Pe={(u,v)},遍历节点对(u,v);判断遍历节点对(u,v)是否完成;若判断获知遍历节点对(u,v)未完成,则对节点u进行负采样,并计算相连损失函数和不相连损失函数;若判断获知节点u在Vtrain中,则根据Strain计算语义损失函数;更新节点u的初始化特征表示、节点v的初始化特征表示以及负采样得到的节点的初始化特征表示;重复判断遍历节点对(u,v)是否完成,直到遍历节点对(u,v)完成。本发明提供的基于结构语义融合的大规模混合图特征学习方法,根据语义标签信息对节点的特征表示进行校正,将语义标签信息作为图特征学习的一部分,提高了图特征学习的质量。 | ||
搜索关键词: | 基于 结构 语义 融合 大规模 混合 特征 学习方法 | ||
【主权项】:
1.一种基于结构语义融合的大规模混合图特征学习方法,其特征在于,包括:获取训练语义标签信息集Strain,所述Strain为训练节点集Vtrain对应的语义标签信息的集合,所述Vtrain是从图中按照预设采样比例随机采样获得的若干个节点的集合,所述图为G,G=(V,E,S),其中,V为图节点,E为图中的边,S为图语义标签信息;获取节点对集Pe,Pe={(u,v)},其中,节点对(u,v)为所述节点对集Pe中的一个元素,节点u和节点v为从所述E中采样获得的某条边对应的两个节点;遍历所述节点对集Pe中的所有节点对(u,v);判断所述遍历是否完成;若判断获知所述遍历未完成,则对所述节点u进行负采样,并计算相连损失函数和不相连损失函数;若判断获知所述节点u在所述Vtrain中,则根据所述Strain计算语义损失函数;根据相连损失函数、不相连损失函数和语义损失函数,更新所述节点u的初始化特征表示、所述节点v的初始化特征表示和所述负采样得到的节点的初始化特征表示,得到所述节点u的新的特征表示、所述节点v的新的特征表示以及所述负采样得到的节点的新的特征表示;重复判断所述遍历是否完成,直到所述遍历完成;还包括:根据节点语义标签信息si和标签lj,生成标签lj的特征表示LFj,其中,所述节点语义标签信息si为训练节点i的语义标签信息,所述si为所述Strain中的元素,所述标签lj为标签集Lj中的元素,所述标签集Lj为训练节点i所包含的标签的集合,所述训练节点i为所述Vtrain中的节点,j为正整数;所述对所述节点u进行负采样,并计算相连损失函数和不相连损失函数具体为:根据预设正负比例对所述节点u进行负采样,得到节点对集![]()
其中,节点对(u,w)为所述节点对集
中的一个元素,节点u和节点w为不相邻的两个节点;计算相连损失函数,具体为,
其中,Lossstructure(u,v)为相连损失函数,NFu为节点u的特征表示,NFv为节点v的特征表示;计算不相连损失函数,具体为,
其中,
为不相连损失函数,NFu为节点u的特征表示,NFw为节点w的特征表示;所述根据所述Strain计算语义损失函数具体为:
其中,
为语义损失函数,标签lu为标签集Lu中的元素,标签
为标签集
中的元素,所述标签集Lu为节点u所包含的标签的集合,所述标签集
为标签集L与所述标签集Lu的差集,所述标签集L为图中所有节点包含的标签的集合,NFu为节点u的特征表示,LFu为标签lu的特征表示,
为标签
的特征表示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711169332.2/,转载请声明来源钻瓜专利网。