[发明专利]一种基于信誉度的引文网络学术影响力评价排序方法有效
申请号: | 201710587023.0 | 申请日: | 2017-07-18 |
公开(公告)号: | CN107391659B | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 冯磊;冀俊忠;徐骋 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/9535;G06F30/20;G06F40/35;G06F40/279;G06Q10/06 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信誉 引文 网络 学术 影响力 评价 排序 方法 | ||
一种基于信誉度的引文网络学术影响力评价排序方法属于学术影响力评价技术领域,结合引文网络的特征,本发明根据文章背景信息定义一系列规则,改进TrustRank算法和Anti‑TrustRank算法选取种子集机制,循环迭代计算网络节点的信誉值和非信誉值,最后综合两者的结果给出评分。根据最终综合信誉值的降序排序结果,获取并输出引文网络中科学文献的学术影响力排序。本发明旨在提供一种合理的、公正的评价方法,能够对文献的影响力准确地评价,从而评选出某一学科内高质量的论文资料。科研人员也能快速地查找文献资料和把握当前研究的热门方向,将更多的时间分配在科学理论研究上。本发明的研究对于认识引文网络的结构和传播特性以及文献影响力评价具有重要的理论意义。
技术领域
本发明属于学术影响力评价技术领域,涉及一种引文网络中基于文献信誉度的学术影响力分析与排序方法。
背景技术
科学文献是传递知识的重要载体,对科学技术的发展起到了巨大的促进作用。科研成果的不断发表,文献间不断增长的引证关系构成了一个大规模的复杂网络——引文网络。从事科研工作的人越来越多,每年发表的文献也呈上升趋势,这在促进科学进步的同时也带来了许多问题,文献质量良莠不齐。科学文献包含论文、期刊、会议和专利等出版物,对于科学技术的进步,科学家科研基金的申请是个重要的评判依据。因此如何识别高质量的文章成为了重要课题。
概况的说,文献影响力评价通常采用两种方法,一种是基于文献计量学方法,另一种是基于引证网络拓扑结构模型的数据挖掘算法。传统的基于统计的方法,如统计文章被引用次数,作者每年发表文章数目等。另一种基于引证网络拓扑结构的方法,本质是依据网页间的链接关系对网页的重要性进行计算。如将衡量搜索引擎旳检索结果网页质量的指标PageRank,应用于引文网络。PageRank算法为马尔科夫过程,描述随机游走者利用信息传递机制在网络中随机游走的过程。但是前两种方法只考虑节点的入度,即被引用次数,忽略了节点的出度即此篇文章发出的引用是否合理及有参考价值。忽略了著作者为了提高排名而不断自引,以及和合作者大量互引现象,当一篇原本质量水平一般的文章被引用了很多的次数,就会获得很高的排名和得分,这种恶意活动(Malicious Activity),给合理公正评价提出了严峻挑战。
虽然文献包含丰富的信息,但是现有引文网络数据对于文献特征并没有完全的表示,更多是利用文章的引证关系把文献铺设成一个网络。网络结构通常具有正、负特性,顶点间通过有向边的调用关系,完成一种有目的的指向和表达。以往的方法只考虑节点的入链次数,基于无标记网络链接关系的迭代排序方法具有很大的局限性忽略了节点的出度即此篇文章发出的引用是否合理及有参考价值。一篇文章的灵感往往是作者广泛阅读前人相关研究的基础上形成的,再结合自身的创造性和主观能动性开展新的研究。所以引文网络中引用与被引用的交互行为,反应了作者对其它文章的参考价值和信任程度。由于科学文献包含丰富的背景信息(Background Information),如期刊、会议和作者以及出版时间等,权威性的作者更喜欢向影响因子高的权威性期刊投递论文,论文质量也一直成为基金申请、职位晋升的重要参考标准。我们试图寻找真正有影响力有意义的文章作为repute信誉节点,同时找到质量一般但却试图不断通过自引以及它引的文章列为不受信节点,迭代查找的方式识别网络中的节点再试图合理评价。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710587023.0/2.html,转载请声明来源钻瓜专利网。