[发明专利]一种基于异构信息网络的科研合作关系预测方法有效

专利信息
申请号: 201910832856.8 申请日: 2019-09-04
公开(公告)号: CN110533253B 公开(公告)日: 2021-05-25
发明(设计)人: 陈志立;杨晴;叶凡;仲红 申请(专利权)人: 安徽大学
主分类号: G06Q10/04 分类号: G06Q10/04;G06F40/205;G06N3/04
代理公司: 安徽省合肥新安专利代理有限责任公司 34101 代理人: 陆丽莉;何梅生
地址: 230601 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于异构信息网络的科研合作关系预测方法,包括如下步骤:1、科技文献异构网络转化为作者‑作者同构网络;2、同构网络中作者节点的向量表示;3、作者间的相似度计算。本发明应用于对任意两个尚未合作过的作者,预测他们在未来合作的可能性,从而有效解决作者‑作者同构网络中的信息丢失和单一化问题,以增加合作预测的准确性,帮助学者更高效的进行科学研究。
搜索关键词: 一种 基于 信息网络 科研 合作关系 预测 方法
【主权项】:
1.一种基于异构信息网络的科研合作关系预测方法,其特征是按如下步骤进行:/n步骤1、科技文献异构网络转化为作者-作者同构网络:/n步骤1.1、构建所述科技文献异构网络G=(V,E);其中,V表示所述科技文献异构网络中的节点集合,所述节点集合的类型包括作者节点集、论文节点集、会议节点集和术语节点集;所述作者节点集记为A={A1,A2,...,Ai,...,Aa},Ai表示第i个作者节点,1≤i≤a;所述论文节点集记为P={P1,P2,...Pw,...Pp},Pw表示第w个论文节点,1≤w≤p;所述会议节点集记为C={C1,C2,...Cn,...Cc},Cn表示第n个会议节点,1≤n≤c;所述术语节点集记为D={D1,D2,...Dr,...Dd},Dr表示第r个术语节点,1≤r≤d;E表示节点之间的关系所形成的边集合,包括作者-论文的撰写关系、会议-论文的发表关系、论文-术语的提及关系、论文-论文的引用关系以及论文-作者的被撰写关系、论文-会议的被发表关系、术语-论文的被提及关系;/n步骤1.2、遍历所述科技文献异构网络中的节点集合V,从而获取元路径集Y=(Y1,Y2,...,Yj,...,YL),其中,Yj表示第j条元路径,且Yj=(Yj1,Yj2,...,Yjg,...,Yjy),Yjg表示第j条元路径Yj上的第g个节点,1≤g≤y;1≤j≤L;/n步骤1.2.1、初始化j=1;/n步骤1.2.2、定义变量τ,并初始化τ=1;/n步骤1.2.3、在所述科技文献异构网络G中将未被访问的第i个作者节点Ai作为当前第τ个访问节点并加入到第j条元路径Yj中,并设置当前第j条元路径Yj的节点个数countj=1;/n步骤1.2.4、随机选择当前第τ个访问节点的邻接节点作为第τ+1个访问节点并加入到第j条元路径Yj中,并将countj的值加1;/n步骤1.2.5、判断countj<Wmax是否成立,若成立,将τ+1赋值给τ后,重复步骤1.2.4,否则,执行步骤1.2.6;其中,Wmax表示所设定的阈值;/n步骤1.2.6、生成第j条元路径Yj:/n步骤1.2.6.1、定义变量β,并初始化β=0;/n步骤1.2.6.2、判断第j条元路径Yj上第Wmax-β个节点是否存在于作者节点集A中,若存在,则生成第j条元路径Yj,执行步骤1.2.7;否则,删除第Wmax-β个节点/n步骤1.2.6.3、将β+1赋值给β,返回步骤1.2.6.2;/n步骤1.2.7、将j+1赋值给j后,判断j≤L是否成立,若成立,则返回步骤1.2.2执行,否则,生成元路径集Y;/n步骤1.3、生成作者-作者同构网络:/n步骤1.3.1、根据所述元路径集Y,得到元路径类型的集合为S={S1,...Sq,...Ss},其中,Sq表示第q个类型的元路径,且表示第q个类型的元路径Sq中第ψ个类型的节点集;且表示第q个类型的元路径Sq中第ψ个节点集中的第μ个节点,1≤μ≤η;表示第q个类型的元路径Sq中第ψ-1个节点集中的第φ个节点,1≤q≤s;/n判断第q个类型的元路径Sq是否对称,且第q个类型的元路径Sq中的节点个数是否为奇数,若是,则执行步骤1.3.2,否则,执行步骤1.3.3;/n步骤1.3.2、将第q个类型的元路径Sq分解为两个等长的子元路径其中,表示第q个类型的元路径Sq的中间节点集;/n令m(ψ-1)ψ表示第μ个节点与第φ个节点是否存在连边,若存在,则令m(ψ-1)ψ=1,否则,令m(ψ-1)ψ=0,从而构造表示科技文献异构网络G中的节点集与节点集的邻接矩阵Mψ-1,ψ,则第一个子元路径Sq1的交换矩阵表示为Mq1=MA,1×M1,2×...×Me-1,e,第二个子元路径Sq2的交换矩阵表示为Mq2=Me,e+1×Me+1,e+2×....×Mu,A;/n利用式(1)生成第q个类型的元路径Sq的作者-作者矩阵Mq:/n /n式(1)中,为第一个子元路径Sq1的交换矩阵Mq1归一化后的矩阵,为第二个子元路径Sq2的交换矩阵Mq2归一化后的矩阵;/n步骤1.3.3、在第q个类型的元路径Sq中增加与第e个类型的节点集Qe和第e+1个类型的节点集Qe+1都存在连接的一个类型的节点集Fq,从而生成更新后的第q个类型的元路径/n将更新后的第q个类型的元路径分解为两个等长的子元路径则第一个更新后的子元路径的交换矩阵表示为第二个更新后的子元路径的交换矩阵表示为/n利用式(2)生成更新后的第q种类型的元路径的作者-作者矩阵/n /n式(2)中,为交换矩阵归一化后的矩阵,为交换矩阵归一化后的矩阵;/n步骤1.3.4、利用式(3)生成元路径类型集S的作者-作者矩阵M:/n /n式(3)中,表示由第q种类型的元路径生成的作者-作者矩阵Mqλq表示第q种类型的元路径Sq的权重,且/n步骤1.3.5、利用作者-作者矩阵M构建作者-作者同构网络G′=(A,ε);其中,ε表示作者节点集A中各个作者节点之间的边;/n步骤2、对作者-作者同构网络G′中的作者节点进行向量表示:/n步骤2.1、令Xiu表示第i个作者Ai和第u个作者Au之间是否存在合作关系的一个变量,若存在,则令Xiu=1,否则,令Xiu=0,从而构造表示作者-作者同构网络G′中各个作者之间关系的a×a维的邻接矩阵X;/n使用工具word2vec将第i个作者Ai所包含的作者属性信息转换成第i个特征向量,从而由a个特征向量构成a×h维的作者特征矩阵H,其中,h为特征向量的维数;/n步骤2.2、利用式(4)生成作者节点嵌入矩阵Z=[z1,...,zi,.,za],zi表示第i个作者节点Ai的向量表示:/nZ=g1(H,X) (4)/n式(4)中,g1()为两层的图卷积网络;/n步骤2.3、利用式(5)生成重构邻接矩阵并使用式(6)计算第i个作者Ai与第u个作者Au之间存在连边的概率/n /n /n式(6)中,zu表示第u个作者节点Au的向量表示;表示重构邻接矩阵中第i个作者Ai和第u个作者Au是否存在合作关系的一个变量,若存在,令否则,令/n步骤2.4、通过最小化式(7)所示的损失函数lg更新作者嵌入矩阵Z,从而得到更新后的作者嵌入矩阵表示更新后的第i个作者节点Ai的向量表示:/n /n步骤3、计算作者-作者同构网络G′=(A,ε)中作者间的相似度;/n步骤3.1、分别利用式(8)和式(9)计算更新后的第i个作者Ai的向量表示与第u个作者Au的向量表示之间的余弦相似度与Tanimoto系数/n /n /n步骤3.2、利用式(10)得到更新后的第i个作者Ai的向量表示与第u个作者Au的向量表示之间的相似度从而得到更新后的第i个作者Ai的向量表示与其他作者的向量表示之间的相似度,并从中选择最大相似度所对应的作者作为第i个作者Ai所预测的最终合作对象:/n /n式(9)中,θ表示Tanimoto系数所占的权重,并有:/n /n式(11)中,R表示与第i个作者Ai和第u个作者Au之间拥有相同合作关系的作者的数量,即R=|AIi∩AIu|num,其中AIi表示与第i个作者Ai合作的作者集,AIu表示与第u个作者Au合作的作者集,B表示与第i个作者Ai拥有合作关系以及与第u个作者Au拥有合作关系的所有作者的数量,即B=|AIi∪AIu|num。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910832856.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top