[发明专利]一种基于学术异构网络的学者影响力评估方法在审
申请号: | 201611242445.6 | 申请日: | 2016-12-29 |
公开(公告)号: | CN106778011A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 孔祥杰;张君;刘鑫童;周金梦;宁兆龙;夏锋 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 大连理工大学专利中心21200 | 代理人: | 温福雪,侯明远 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于学术异构网络的学者影响力评估方法,在论文-学者异构网络中对学术主体的互动和沟通联系进行分析,并在使用论文-学者网络评估学者影响力时,通过PageRank算法和论文之间的引用关系区分论文的重要性。同时,考虑到论文的引用数量需要时间不断积累这一特性,本方法根据不同论文的发表时间加入时间函数,对PageRank算法做出改进,强化了发表时间对论文重要性的影响。本发明能够在以上分析的基础上通过随机游走算法在论文-学者网络中对学者影响力进行评估,从而提高学者影响力评价的准确性与可靠性,为学者影响力评估工作以及对科研奖项、基金审批等工作提供依据。 | ||
搜索关键词: | 一种 基于 学术 网络 学者 影响力 评估 方法 | ||
【主权项】:
一种基于学术异构网络的学者影响力评估方法,其特征在于,步骤如下:1)通过论文引用网络以及改进的PageRank算法,计算论文基于时间感知的重要性分值首先根据真实数据集中某一领域待评估论文的相互引用关系构建论文的有向引文网络,有向引文网络中边的方向从引用论文指向被引用论文;根据每篇论文随着时间变化在每一年份的平均被引频次,不断积累的,是一个逐渐增加的过程这一特点以及论文在单个年份被引用的次数,从平均情况来看,是随着时间不断减小这一趋势,本方法使用加入时间因素的改进PageRank算法计算论文基于时间感知的重要性;使用如下公式定义一篇论文的已发表年限age:age=Tc‑Tp其中,Tc为当前的年份,Tp为该论文发表的年份;基于时间函数的改进PageRank算法公式如下:PR(pi)=(1-d)f(agei)Σk=1Nf(agek)+dΣj=1mPR(pj)*f(agej)L(pj)]]>其中,PR(pi)表示论文pi的PageRank值,pj表示引用论文pi的文献,PR(pj)表示论文pj的PageRank值,agei表示论文pi的已发表年限,agej表示论文pj的已发表年限;对待评估论文在发表时间上的重要性做归一化处理,f(age)是时间函数,且函数的值随着age增加而减小,f(agei)表示论文pi的时间权重,f(agej)表示论文pj的时间权重,表示待评估论文时间权重的加和;L(pj)为论文pj所引用的所有论文的总数量;d为阻尼系数,同PageRank中一样,设为0.85;在时间函数上取值越大的论文(即发表年份越近的论文),取得的论文重要性分值越大;论文pi从指向它的论文(引用pi的论文)获得分值;m是引用论文pi的文献的总数量;2)将步骤1)中得到的论文基于时间感知的重要性分值代入论文-学者异构无向网络,作为论文在该网络中的初始权值根据待评估论文和学者信息构建论文-学者异构无向网络,该网络中的边代表学者与其发表的全部论文的对应关系;将步骤1)中得出的基于时间感知的论文重要性分值作为论文-学者异构无向网络中论文的初始权值进行初始化;将每名学者的初始权值设置为1/n,其中n是全部学者数量;3)在步骤2)中建立的论文-学者异构无向网络上,通过论文与学者之间的随机游走模型计算学者的影响力,由此将论文的影响力作用于学者随机游走模型如下:假设论文-学者异构无向网络中学者的数量为Na,论文的数量为Np;则所有学者初始的分值RW值是相同的,设为1/Na;所有论文初始的分值RW值是相同的,设为1/Np;具体如下:Step 1:根据如下公式更新学者的RW值:RW(ai)=1-dNa+dΣs=1nRW(ps)C(ps)]]>其中,RW(ai)是学者ai在随机游走模型中获得RW值,ps为学者ai所著的任意一篇论文,RW(ps)为其在随机游走模型中的RW值,C(ps)为ps中所列出的所有作者的人数,可见论文的分值是平均分配给它的所有作者的;d同PageRank中一样,设为0.85;通过该公式反映出,学者有1‑d的概率被随机访问,有d的概率通过他所写的论文被访问;n是学者ai所著的总论文数;Step 2:根据如下公式更新论文的分数:RW(ps)=1-dNp+dΣi=1qRW(ai)C(ai)]]>其中,ps为学者ai所著的任意一篇论文,RW(ps)为其在随机游走模型中的RW值,RW(ai)是学者ai在随机游走模型中获得RW值,q是论文ps所列出的所有作者数;d同PageRank中一样,设为0.85;C(ai)为学者ai所写的论文的数量;即一个学者的RW值,平均分配给他所写的所有论文;Step 3:重复Step 1和Step 2,直到所有学者的RW值和所有论文的RW值均收敛;判断收敛的标准是,所有学者两轮迭代得到的不同的RW值的差值的总和小于一个固定的阈值;通过以上三步,得到所有学者的影响力的值并进行排名。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611242445.6/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用