[发明专利]一种基于异构信息网络的科研合作关系预测方法有效
申请号: | 201910832856.8 | 申请日: | 2019-09-04 |
公开(公告)号: | CN110533253B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 陈志立;杨晴;叶凡;仲红 | 申请(专利权)人: | 安徽大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06F40/205;G06N3/04 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230601 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于异构信息网络的科研合作关系预测方法,包括如下步骤:1、科技文献异构网络转化为作者‑作者同构网络;2、同构网络中作者节点的向量表示;3、作者间的相似度计算。本发明应用于对任意两个尚未合作过的作者,预测他们在未来合作的可能性,从而有效解决作者‑作者同构网络中的信息丢失和单一化问题,以增加合作预测的准确性,帮助学者更高效的进行科学研究。 | ||
搜索关键词: | 一种 基于 信息网络 科研 合作关系 预测 方法 | ||
【主权项】:
1.一种基于异构信息网络的科研合作关系预测方法,其特征是按如下步骤进行:/n步骤1、科技文献异构网络转化为作者-作者同构网络:/n步骤1.1、构建所述科技文献异构网络G=(V,E);其中,V表示所述科技文献异构网络中的节点集合,所述节点集合的类型包括作者节点集、论文节点集、会议节点集和术语节点集;所述作者节点集记为A={A1,A2,...,Ai,...,Aa},Ai表示第i个作者节点,1≤i≤a;所述论文节点集记为P={P1,P2,...Pw,...Pp},Pw表示第w个论文节点,1≤w≤p;所述会议节点集记为C={C1,C2,...Cn,...Cc},Cn表示第n个会议节点,1≤n≤c;所述术语节点集记为D={D1,D2,...Dr,...Dd},Dr表示第r个术语节点,1≤r≤d;E表示节点之间的关系所形成的边集合,包括作者-论文的撰写关系、会议-论文的发表关系、论文-术语的提及关系、论文-论文的引用关系以及论文-作者的被撰写关系、论文-会议的被发表关系、术语-论文的被提及关系;/n步骤1.2、遍历所述科技文献异构网络中的节点集合V,从而获取元路径集Y=(Y1,Y2,...,Yj,...,YL),其中,Yj表示第j条元路径,且Yj=(Yj1,Yj2,...,Yjg,...,Yjy),Yjg表示第j条元路径Yj上的第g个节点,1≤g≤y;1≤j≤L;/n步骤1.2.1、初始化j=1;/n步骤1.2.2、定义变量τ,并初始化τ=1;/n步骤1.2.3、在所述科技文献异构网络G中将未被访问的第i个作者节点Ai作为当前第τ个访问节点并加入到第j条元路径Yj中,并设置当前第j条元路径Yj的节点个数countj=1;/n步骤1.2.4、随机选择当前第τ个访问节点的邻接节点作为第τ+1个访问节点并加入到第j条元路径Yj中,并将countj的值加1;/n步骤1.2.5、判断countj<Wmax是否成立,若成立,将τ+1赋值给τ后,重复步骤1.2.4,否则,执行步骤1.2.6;其中,Wmax表示所设定的阈值;/n步骤1.2.6、生成第j条元路径Yj:/n步骤1.2.6.1、定义变量β,并初始化β=0;/n步骤1.2.6.2、判断第j条元路径Yj上第Wmax-β个节点 是否存在于作者节点集A中,若存在,则生成第j条元路径Yj,执行步骤1.2.7;否则,删除第Wmax-β个节点 /n步骤1.2.6.3、将β+1赋值给β,返回步骤1.2.6.2;/n步骤1.2.7、将j+1赋值给j后,判断j≤L是否成立,若成立,则返回步骤1.2.2执行,否则,生成元路径集Y;/n步骤1.3、生成作者-作者同构网络:/n步骤1.3.1、根据所述元路径集Y,得到元路径类型的集合为S={S1,...Sq,...Ss},其中,Sq表示第q个类型的元路径,且 表示第q个类型的元路径Sq中第ψ个类型的节点集;且 表示第q个类型的元路径Sq中第ψ个节点集 中的第μ个节点,1≤μ≤η; 表示第q个类型的元路径Sq中第ψ-1个节点集 中的第φ个节点,1≤q≤s; /n判断第q个类型的元路径Sq是否对称,且第q个类型的元路径Sq中的节点个数是否为奇数,若是,则执行步骤1.3.2,否则,执行步骤1.3.3;/n步骤1.3.2、将第q个类型的元路径Sq分解为两个等长的子元路径 和 其中, 表示第q个类型的元路径Sq的中间节点集;/n令m(ψ-1)ψ表示第μ个节点 与第φ个节点 是否存在连边,若存在,则令m(ψ-1)ψ=1,否则,令m(ψ-1)ψ=0,从而构造表示科技文献异构网络G中的节点集 与节点集 的邻接矩阵Mψ-1,ψ,则第一个子元路径Sq1的交换矩阵表示为Mq1=MA,1×M1,2×...×Me-1,e,第二个子元路径Sq2的交换矩阵表示为Mq2=Me,e+1×Me+1,e+2×....×Mu,A;/n利用式(1)生成第q个类型的元路径Sq的作者-作者矩阵Mq:/n /n式(1)中, 为第一个子元路径Sq1的交换矩阵Mq1归一化后的矩阵, 为第二个子元路径Sq2的交换矩阵Mq2归一化后的矩阵;/n步骤1.3.3、在第q个类型的元路径Sq中增加与第e个类型的节点集Qe和第e+1个类型的节点集Qe+1都存在连接的一个类型的节点集Fq,从而生成更新后的第q个类型的元路径 /n将更新后的第q个类型的元路径 分解为两个等长的子元路径 和 则第一个更新后的子元路径 的交换矩阵表示为 第二个更新后的子元路径 的交换矩阵表示为 /n利用式(2)生成更新后的第q种类型的元路径 的作者-作者矩阵 /n /n式(2)中, 为交换矩阵 归一化后的矩阵, 为交换矩阵 归一化后的矩阵;/n步骤1.3.4、利用式(3)生成元路径类型集S的作者-作者矩阵M:/n /n式(3)中, 表示由第q种类型的元路径 生成的作者-作者矩阵Mq或 λq表示第q种类型的元路径Sq或 的权重,且 /n步骤1.3.5、利用作者-作者矩阵M构建作者-作者同构网络G′=(A,ε);其中,ε表示作者节点集A中各个作者节点之间的边;/n步骤2、对作者-作者同构网络G′中的作者节点进行向量表示:/n步骤2.1、令Xiu表示第i个作者Ai和第u个作者Au之间是否存在合作关系的一个变量,若存在,则令Xiu=1,否则,令Xiu=0,从而构造表示作者-作者同构网络G′中各个作者之间关系的a×a维的邻接矩阵X;/n使用工具word2vec将第i个作者Ai所包含的作者属性信息转换成第i个特征向量,从而由a个特征向量构成a×h维的作者特征矩阵H,其中,h为特征向量的维数;/n步骤2.2、利用式(4)生成作者节点嵌入矩阵Z=[z1,...,zi,.,za],zi表示第i个作者节点Ai的向量表示:/nZ=g1(H,X) (4)/n式(4)中,g1()为两层的图卷积网络;/n步骤2.3、利用式(5)生成重构邻接矩阵 并使用式(6)计算第i个作者Ai与第u个作者Au之间存在连边的概率 /n /n /n式(6)中,zu表示第u个作者节点Au的向量表示; 表示重构邻接矩阵 中第i个作者Ai和第u个作者Au是否存在合作关系的一个变量,若存在,令 否则,令 /n步骤2.4、通过最小化式(7)所示的损失函数lg更新作者嵌入矩阵Z,从而得到更新后的作者嵌入矩阵 表示更新后的第i个作者节点Ai的向量表示:/n /n步骤3、计算作者-作者同构网络G′=(A,ε)中作者间的相似度;/n步骤3.1、分别利用式(8)和式(9)计算更新后的第i个作者Ai的向量表示 与第u个作者Au的向量表示 之间的余弦相似度 与Tanimoto系数 /n /n /n步骤3.2、利用式(10)得到更新后的第i个作者Ai的向量表示 与第u个作者Au的向量表示 之间的相似度 从而得到更新后的第i个作者Ai的向量表示 与其他作者的向量表示之间的相似度,并从中选择最大相似度所对应的作者作为第i个作者Ai所预测的最终合作对象:/n /n式(9)中,θ表示Tanimoto系数 所占的权重,并有:/n /n式(11)中,R表示与第i个作者Ai和第u个作者Au之间拥有相同合作关系的作者的数量,即R=|AIi∩AIu|num,其中AIi表示与第i个作者Ai合作的作者集,AIu表示与第u个作者Au合作的作者集,B表示与第i个作者Ai拥有合作关系以及与第u个作者Au拥有合作关系的所有作者的数量,即B=|AIi∪AIu|num。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910832856.8/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理