[发明专利]一种基于作者著作树和图神经网络的论文合作者推荐方法有效
申请号: | 202010710086.2 | 申请日: | 2020-07-22 |
公开(公告)号: | CN112069306B | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 杜一;乔子越;周园春;宁致远 | 申请(专利权)人: | 中国科学院计算机网络信息中心 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/332;G06N3/04;G06N3/08 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 司立彬 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 作者 著作 神经网络 论文 合作者 推荐 方法 | ||
本发明公开了一种基于作者著作树和图神经网络的论文合作者推荐方法,其步骤包括:1)对于数据库中的每一个作者,收集该作者的论文并提取关键词信息,构建该作者的著作树;2)对每个著作树,基于图神经网络模型构建对应作者著作树的信息传播模型,将著作树上的论文信息和关键词信息传播到作者节点中,编码出对应作者初始的表征向量;3)从该数据库中抽取出所有合作过的作者对集合,训练信息传播模型的参数,优化各初始表征向量,得到各作者最终的表征向量;4)对于一需推荐合作者的论文A,遍历与论文A的作者未曾合作过的作者集合N;然后比较作者A与集合N中每一作者最终的表征向量余弦相似度,根据计算结果为论文A的作者推荐合作者。
技术领域
本发明主要涉及实体消歧,异质网络嵌入技术领域,词向量嵌入技术领域,具体是一种基于作者著作树和图神经网络的论文合作者推荐方法。
背景技术
现代科学出现了综合化、交叉化的新趋势,单人完成科研活动正变得越来越困难,科研协作显得尤为重要。科研协作可以促进科研人员之间的交流、实现科研资源的整合和高效利用。因此,寻求合作者是科研工作者的重要学术活动之一,因为合适的合作者会有助于提升科研效率、科研创新能力和科研质量。对于科研人员来说,如何快速、高质量的找到合适的科研合作者成为目前亟待解决的一个问题。另一方面,随着我国高校科研管理信息化建设的不断推进,积累了丰富的科研数据资源,如何发掘并利用已有科研管理数据资源来解决这一问题是一个值得探讨的课题。随着信息技术的快速发展,科研平台已经广泛出现,并且吸引了大量的研究人员通过虚拟社区来开展科研合作。在这些科研平台上,研究者们可以发布自己的研究成果,浏览其他学者的公开信息,跟踪同行学者的科研进展,寻求潜在的合作机会。然而随着学术数据的大量增长,研究者在面对数字科研平台中的海量数据时,往往需要花费许多的时间定位到自己感兴趣的潜在合作者,用户常常对于想要认识那些学者、可以和哪些相似的学者进行合作是不明确的。因此,利用这些科研平台的科研数据库开发出高效的合作者推荐系统将有效地促进学术合作与知识共享。合作者推荐系统往往通过分析已有作者的科研成果,通过对作者发表的论文的信息进行挖掘,得到其研究内容和方向的表征,进而通过表征的相似性寻找到与目标作者研究方向一致的且没有合作过的学者进行推荐。
发明内容
本发明的目的是提供了一种基于作者著作树结构和图神经网络信息传播模型的论文合作者推荐技术方案。该技术方案利用作者已发表的论文和论文的关键词信息来构建作者著作树,利用论文中的标题,摘要,关键词文本信息得到作者著作树中各个节点的初始表征向量。使用基于图神经网络的信息传递模型编码和优化作者节点的最终表征向量。最终通过作者最终表征向量之间的余弦相似度比较作者研究方向的接近程度,进而给目标作者推荐接近程度高的合作者。
本发明具体包括以下步骤:
步骤一:在科研数据库中,对于其中的每一个作者,收集该作者所著的所有论文,并收集这些论文的关键词信息,构建其著作树。
步骤二:根据步骤一对每个作者构建的著作树,基于图神经网络模型构建信息传播模型,将著作树上的论文和关键词信息传播到作者节点中,编码出作者的最终表征向量。
步骤三:从科研数据库中抽取所有合作过的作者对集合。根据步骤二中构建的信息传播模型和交叉熵损失函数训练参数,优化作者的最终表征向量。
步骤四:根据步骤一到步骤三生成的作者最终表征向量,给定任一作者,向其推荐合作者。
本发明的技术方案为:
一种基于作者著作树和图神经网络的论文合作者推荐方法,其步骤包括:
1)对于数据库中的每一个作者,收集该作者所著的论文并提取所收集论文中的关键词信息,构建该作者的著作树;
2)对每个作者的著作树,基于图神经网络模型构建该作者著作树的信息传播模型,将著作树上的论文信息和关键词信息传播到作者节点中,编码出对应作者初始的表征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算机网络信息中心,未经中国科学院计算机网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010710086.2/2.html,转载请声明来源钻瓜专利网。