[发明专利]一种基于引用预测的参考文献推荐方法有效

专利信息
申请号: 201711118352.7 申请日: 2017-11-06
公开(公告)号: CN108132961B 公开(公告)日: 2020-06-30
发明(设计)人: 梅建萍;陈德仿 申请(专利权)人: 浙江工业大学
主分类号: G06F16/335 分类号: G06F16/335;G06F16/35
代理公司: 杭州赛科专利代理事务所(普通合伙) 33230 代理人: 郭薇
地址: 310014 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 引用 预测 参考文献 推荐 方法
【说明书】:

发明涉及一种基于引用预测的参考文献推荐方法,收集论文,采集论文信息并进行筛选,保留有效数据,构造训练集,并进行特征表示,计算得到一组特征值,针对每个特征进行归一化后训练引用预测模型,基于预测模型,对给定论文进行引用预测和参考文献推荐。本发明通过把论文对作为对象,定义若干特征对其进行描述,并把已知两篇论文之间的引用关系作为该论文对的标签,把两篇论文之间的引用关系的预测问题建模成一个经典的回归或者二值分类问题,在给定一篇目标论文的前提下,首先得到该论文与其他备选文献之间构成的论文对的特征表示,然后利用训练好的模型进行预测,得到被该论文引用的可能性最大的若干篇论文作为参考文献进行推荐。

技术领域

本发明属于特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法的技术领域,特别涉及一种基于引用预测的参考文献推荐方法。

背景技术

在广大科研人员进行学术研究的过程中,学术刊物是呈现专业领域研究趋势以及指导科研工作的重要资源。

在学术研究领域,科研人员往往需要通过大量阅读参考文献,进而全面了解同一个研究课题下已有的工作推进情况以及获知最新的研究成果,从而帮助他们最大程度地避免重复的科研劳动、掌握相关课题及同行工作的最新动态和发展方向、为更进一步的研究打下坚实的基础。参考文献列表的完善程度也往往是论文在投稿评审时评委考量该研究工作质量和水平的一个重要方面。

现有的学术研究工作中,由于缺乏功能完善、令人满意的参考文献推荐系统,科研人员一般在搜索引擎如Google Scholar或者某一特定的数据库如Web of Science中通过设定主题、关键词等方法来手动挑选可能与自己当前研究领域相关的论文,然而即便对具有一定专业背景和文献检索技巧的研究者来说,想要得到一个综合全面性、代表性和及时性的参考文献列表也要花费不少精力和时间,更不用说那些新入门者。近几年,由于学术文献数量之大,增长更新之快,加之使用电子出版物和开放数据库的流行,更加凸显出目前这种手动挑选的方法耗时长、准确率低、操作过程机械化的弊端,因而亟需搭建一个更自动化且有效的系统来帮助研究人员快速地定位所需的相关文献,大量学术数据的存在为此提供了机会,可以运动知识发现的技术,如通过数据挖掘等各种数据驱动的方法,来自动生成参考文献列表,从而准确高效地进行参考文献推荐。

发明内容

本发明解决的技术问题是,现有技术中,由于缺乏功能完善、令人满意的参考文献推荐系统,而导致的即便对具有一定专业背景和文献检索技巧的研究者来说,想要得到一个综合全面性、代表性和及时性的参考文献列表也要花费不少精力和时间,且由于近年学术文献数量之大,增长更新之快,加之使用电子出版物和开放数据库的流行,目前这种手动挑选的方法耗时长、准确率低、操作过程机械化的弊端充分暴露的问题,进而提供了一种优化的基于引用预测的参考文献推荐方法。

本发明所采用的技术方案是,一种基于引用预测的参考文献推荐方法,所述方法包括以下步骤:

步骤1:收集论文,采集论文信息并进行筛选,保留有效数据;

步骤2:构造训练集,并进行特征表示,计算得到一组特征值;

步骤3:针对每个特征进行归一化后训练引用预测模型;

步骤4:基于预测模型,对给定论文进行引用预测和参考文献推荐。

优选地,所述步骤1中,论文信息包括论文标题、论文摘要、作者信息、发表年份、发表刊物、参考文献和被引用量。

优选地,所述作者信息包括作者姓名、研究机构、总发表论文数、总被引用次数、H指数和研究兴趣;所述筛选包括删去所述总被引用次数小于M1、或所述总发表论文数小于M2、或所述H指数小于M3的作者信息,并删除所述作者信息对应的论文信息;所述M1∈[1,10],M2∈[1,10],M3∈[1,3]。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711118352.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top