[发明专利]一种基于作者著作树和图神经网络的论文合作者推荐方法有效
申请号: | 202010710086.2 | 申请日: | 2020-07-22 |
公开(公告)号: | CN112069306B | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 杜一;乔子越;周园春;宁致远 | 申请(专利权)人: | 中国科学院计算机网络信息中心 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/332;G06N3/04;G06N3/08 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 司立彬 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 作者 著作 神经网络 论文 合作者 推荐 方法 | ||
1.一种基于作者著作树和图神经网络的论文合作者推荐方法,其步骤包括:
1)对于数据库中的每一个作者,收集该作者所著的论文并提取所收集论文中的关键词信息,构建该作者的著作树;其中构建作者的著作树的方法为:将作者所著论文及论文的关键词都看作是节点,构建出一个具有三层节点的著作树;其中,第一层的根节点是该著作树的作者节点;第二层是论文节点,并与该作者节点相连;第三层是关键词节点,每个关键词节点与包含该关键词的论文节点相连;
2)对每个作者的著作树,基于图神经网络模型构建该作者著作树的信息传播模型,将著作树上的论文信息和关键词信息传播到作者节点中,编码出对应作者初始的表征向量;其中,所述信息传播模型为其中ai代表著作树中作者的初始表征向量,pi代表著作树中论文的初始表征向量,ti代表著作树中关键词的初始表征向量;所述信息传播模型的传播方法为:首先任一与初始表征向量为pi的论文节点相连的关键词节点将自身的初始表征向量ti的信息传递给该论文节点,论文节点整合自身的信息和其所有关键词信息生成新的隐层表征向量p′i;然后任一与初始表征向量为ai的作者节点相连的论文节点将自身的隐层表征向量p′i的信息传递给该作者节点,作者节点整合自身的信息和其所有论文信息生成了作者的最终表征向量a′i;其中N(pi)表示所有与初始表征向量为pi的论文节点相连的关键词节点的表征向量的集合,W1是论文向自身传播信息所使用的传播矩阵,W2是关键词向论文传播信息所使用的传播矩阵,ReLU()为激活函数,N(ai)表示所有与初始表征向量为ai的作者节点相连的论文节点的隐层表征向量的集合,W3是作者向自身传播信息所使用的传播矩阵,W4是论文向作者传播信息所使用的传播矩阵;
3)从该数据库中抽取出所有合作过的作者对集合,然后根据信息传播模型和交叉熵损失函数训练信息传播模型的参数W1、W2、W3和W4,优化各作者初始的表征向量,得到各作者最终的表征向量;
4)对于一需要推荐合作者的论文A,遍历该数据库获取与该论文A的作者未曾合作过的作者集合N;然后比较该作者A最终的表征向量与该作者集合N中每一作者最终的表征向量的余弦相似度,根据余弦相似度计算结果为该论文A的作者推荐论文合作者。
2.如权利要求1所述的方法,其特征在于,ai、pi、ti均是维度为d1的向量,W1是维度为d2×d1的矩阵,W2是维度为d2×d1的矩阵,W3是维度为d3×d1的矩阵,W4是维度为d3×d2的矩阵,d1、d2、d3均为设定值。
3.如权利要求1或2所述的方法,其特征在于,采用交叉熵损失函数训练所述信息传播模型的参数W1、W2、W3和W4;其中(a′i,a′j)∈P代表最终的表征向量分别为a′i和a′j的两个作者组成的作者对属于作者对集合P,D(a′i)表示随机选取的K个没有与最终的表征向量为a′i的作者合作过的作者组成的集合,其中K为一设定值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算机网络信息中心,未经中国科学院计算机网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010710086.2/1.html,转载请声明来源钻瓜专利网。