[发明专利]一种基于论文引用关系的黄金引用作者发现方法有效
申请号: | 201810769032.6 | 申请日: | 2018-07-13 |
公开(公告)号: | CN109063023B | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 吴晨生 | 申请(专利权)人: | 北京市科学技术情报研究所 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/335 |
代理公司: | 北京元中知识产权代理有限责任公司 11223 | 代理人: | 王明霞 |
地址: | 100044 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及论文检索技术领域,具体地说,涉及一种基于论文引用关系的黄金引用作者发现方法,包括如下步骤:首先,在论文数据库中选定论文群体范围,获取引用关系以及作者信息;其次,依据论文群体中论文的相互引用关系及作者信息构建初始论文引用网络模型;再次,标定初始论文引用属性,建立自引修订引用系数,生成排除自引的论文他引网络;然后,将论文他引网络通过线性映射生成作者引用网络;最后,采用递归删除的方式缩小作者引用网络的范围,直至结果收敛,输出得到黄金引用作者。本发明提供的论文作者发现方法易于实施,且可有效排除论文自引和低质低效的他引干扰,以帮助研究者快速地准确地识别出黄金引用作者。 | ||
搜索关键词: | 引用 论文引用 引用关系 作者信息 网络 论文数据库 检索技术 网络模型 线性映射 标定 发现 递归 构建 群体 删除 收敛 输出 修订 帮助 | ||
【主权项】:
1.一种基于论文引用关系的黄金引用作者发现方法,其特征在于,包括如下步骤:首先,在论文数据库中选定论文群体范围,获取引用关系以及作者信息;其次,依据论文群体中论文的相互引用关系及作者信息构建初始论文引用网络模型;再次,标定初始论文引用属性,建立自引修订引用系数,生成排除自引的论文他引网络;然后,将论文他引网络通过线性映射生成作者引用网络;最后,采用递归删除的方式缩小作者引用网络的范围,直至结果收敛,输出得到黄金引用作者;所述初始引用网络模型为:G=(V,E),G=(V,E)是由|V|=N个论文节点和|E|=M条边所组成的一个有向网络;其中,G代表论文群体中论文以及论文间引用关系的集合,V代表论文群体G中的论文集合,E代表论文群体G中论文间的引用关系;为构建论文引用网络模型,引入论文引用变量ei,j,ei,j代表论文群体G中论文vi与论文vj的引用关系,若论文vi被论文vj引用,则ei,j等于1;若论文vi未被论文vj引用,则ei,j等于0,其中i≥1,j≥1;在论文群体G中以第i篇论文为节点的被引次数通过引用变量ei,j累加得到,则建立第i篇论文在论文群体G中的被引次数关系式为
所述生成排除自引的论文他引网络包括如下步骤:标定论文引用属性,若论文vi被论文vj引用,当论文vi与论文vj中没有相同作者,则该次引用为他引;当论文vi与论文vj中至少有一个相同作者,则该次引用为自引;为标定论文引用属性,引入自引系数λi,j,若论文vi与被引论文vj为自引关系,则λi,j等于0;若论文vi与被引论文vj为他引关系,则λi,j等于1;其中,i≥1,j≥1;论文vi被论文vj引用且为自引,则引用系数ei,j与自引系数λi.j的乘积为0;论文vi被论文vj引用且为他引,则引用变量ei,j与自引系数λi.j的乘积为1;通过对引用变量ei,j与自引系数λi.j的乘积相累加,排除了第i篇论文在初始引用网络模型中的自引用关系,则建立第i篇论文在论文群体中的自引修订引用次数公式为
其中,i≥1,j≥1;依据自引修订引用次数为
生成排除自引的论文他引网络模型G'=(V',E');G'=(V',E')是由|V'|=N个节点和|E'|=M'条边所组成的一个有向网络;将论文他引网络通过线性映射生成作者引用网络,作者为顶点,作者引用关系为边;作者群体Gauth.=(Vauth.,Eauth.)是由|Vauth.|=Nauth.个节点和|Eauth.|=Mauth.条边所组成的一个有向网络;其中,Gauth.代表作者群体中作者以及作者间引用关系的集合,Vauth.代表作者群体Gauth.中的作者集合,Eauth.代表作者群体Gauth.中作者间的引用关系;引入作者引用变量
代表作者群体Gauth.中作者
与作者
的引用关系,若作者
发表的某一篇论文被作者
发表的某一篇论文引用,记为1,
是作者
指向作者
有向边数量之和,即作者
发表论文被作者
引用次数总和,记为m;若作者
发表的论文未被作者
发表的论文引用,则记为0;在作者群体Gauth.中作者i的被引次数通过引用变量
累加得到,则建立作者i在作者群体Gauth.中的被引次数关系式为
作者
可多次被作者
引用,或者,作者
可引用作者
通过删除引用网络中的边缘性节点缩小作者引用网络的范围,引入被引次数设定值k,k依次由小到大取值,采用递归的方式逐层缩小作者群体的范围,直至结果收敛,其中,k为整数,且k≥0;当第k层筛选的初始作者群体为Gauth.,k时,Gauth.,k中含有
个节点,即含有
个作者,
条引用关系,作者i在作者群体Gauth.,k中的被引次数关系式为
采用递归的方式缩小Gauth.,k的范围,删除Gauth.,k中被引次数
等于k的作者及其引用关系,生成作者群体
作者i在作者群体
中的被引次数关系式为
继续删除
中
不大于k的作者及其引用关系,并生成作者群体
作者i在作者群体
中的被引次数关系式为
继续递归删除,直至生成作者群体
作者i在作者群体
中的被引次数关系式为
且
形成第k+1层的初始作者群体,即
记作Gauth.,k+1;每层递归删除的作者组成第k层作者群体
删除后的作者群体Gauth.,k+1中含有
个节点,即含有
个作者,
条边,作者i在作者群体Gauth.,k+1中的被引次数关系式为
且
其中,k、q为整数,且k≥0,q≥1。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市科学技术情报研究所,未经北京市科学技术情报研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810769032.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种服务器系统信息的提取方法
- 下一篇:一种社交平台用户影响力计算方法及装置