[发明专利]一种学术异构信息网络中作者合作关系预测的方法在审
申请号: | 201611242612.7 | 申请日: | 2016-12-29 |
公开(公告)号: | CN106778894A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 夏锋;刘鑫童;宁兆龙;张舒虹;王伟 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 大连理工大学专利中心21200 | 代理人: | 温福雪,侯明远 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 学术 信息网络 作者 合作关系 预测 方法 | ||
技术领域
本发明涉及学术异构信息网络下的作者合作关系预测方法,尤其涉及一种基于元路径和内容信息的合作预测方法。
背景技术
随着科学研究在学术界和工业界广泛进行,学者们创造出源源不断的大量科研成果,于是学术大数据应运而生。学术大数据中存在不同的学术主体以及它们之间形成的各种各样的学术关系,其中学者之间的合作关系最为普遍和重要,尤其在交叉学科问题的研究中,来自不同领域的学者之间的合作日益增多,这使得对于合作关系预测的研究变得越来越重要。但在现有的技术中,大多数解决方法都是基于同构信息网络的,而且预测方法都是基于节点、拓扑和网络内容信息相似性等,而这些并不能很好的体现出学者之间的相互联系,没有考虑节点属性和网络的内容信息等对预测结果的影响。总结以上缺点,本发明从学术异构信息网络抽取的基于元路径和内容信息的特征空间作为输入,利用有监督学习算法进行学者合作关系预测,能够提高合作者的预测准确率。
发明内容
本发明的目的主要针对上述现有研究的一些不足之处,提出学术异构信息网络下基于元路径和内容信息的合作预测方法,利用有监督学习算法进行学者合作关系预测。本发明将作者之间未来合作的可能性建模为他们之间特征属性的函数,从训练集中获取作者之间的特征属性,然后通过建立预测模型来得到与每个属性特征相关的最适合系数。
本发明的技术方案:
一种学术异构信息网络中作者合作关系预测的方法,步骤如下:
1)模型训练阶段,选出在过去时间段没有合作过的作者对,收集其在过去时间段内相关的基于元路径和内容信息的特征属性,并记录他们在未来时间段中是否建立合作关系
本方法提出的预测模型采用基于逻辑回归的有监督学习算法,在一个学术异构信息网络G=<V,E>中,V代表信息网络中的节点,E代表节点之间的交互,任意连边e=<x,y>∈E表示节点x和y之间在某一特定时间t(e)的交互,并用平行边记录节点对之间的多重交互及其潜在时间戳信息;对于任意两个时间节点t<t′,用G[t,t′]表示包含时间段t到t′之间所有连边的子图,链路预测问题的具体描述如下:选择四个时间戳t0<t′0<t1<t′1,链路预测就是预测在G[t0,t′0]中没有出现而将在G[t1,t′1]中出现的连边,并用T0=[t0,t′0]表示过去时间段,T1=[t1,t′1]表示未来时间段;但是,信息网络随着新的连边和节点的加入不断增长,显然对于预测不存在于过去时间段中的节点对之间的连边是不明智的。因此,本方法选出核心节点集合,即节点既存在于过去时间段的子图G[t0,t′0]中,也存在于未来时间段的子图G[t1,t′1]中,然后预测在核心节点集合中的节点之间产生新连边的可能性。
在模型训练阶段,首先选出在T0时间段没有合作过的作者对,收集其在T0时间段相关的基于元路径和内容信息的特征属性,根据真实网络情况,查看并记录他们在未来时间段T1中是否建立合作关系。
2)建立训练模型,通过最大化合作关系的可能性学习与每个特征属性相关的最佳权重系数
2.1)计算基于时间动态的路径数:学术异构信息网络是随时间变化的,学术异构信息网络中学术主体之间形成的路径也是具有时变性的,本方法通过对这些路径设置不同权重来实现对在不同时间戳形成的路径进行影响力区分。综合考虑学术异构信息网络中的时间动态特性和基于元路径的路径数度量,得到基于时间动态的路径数属性。
一个元路径以由很多短的子元路径连接而成,而且学术异构信息网络中的路径通常是事件发生的结果;为区分不同元路径的影响力,首先将元路径分解为很多事件子元路径,例如,元路径“作者-论文-会议-论文-作者”描述了两个作者在同一会议发表论文的关系,可以被分解为“作者-论文-会议”和“会议-论文-作者”,这两个事件子元路径都描述了作者在某一会议发表论文的事件。之后,根据这些事件子元路径建立的时间参考衰减函数为其设置不同权重。
给定一个元路径P=(A1A2L Al),它的交换矩阵表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611242612.7/2.html,转载请声明来源钻瓜专利网。