[发明专利]基于论文作者信息提取和关系权值模型的学术关系网构造方法在审
申请号: | 201410395729.3 | 申请日: | 2014-08-13 |
公开(公告)号: | CN104156437A | 公开(公告)日: | 2014-11-19 |
发明(设计)人: | 袁伟;邓攀;闫碧莹;李玉成 | 申请(专利权)人: | 中科嘉速(北京)并行软件有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 祗志洁 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于论文作者信息提取和关系权值模型的学术关系网构造方法。本发明针对特定领域,首先提取作者库中所有作者信息,构建初始的作者关系矩阵,其次建立作者关系权值模型,根据每篇论文的作者信息更新作者关系矩阵,然后基于作者关系矩阵确定两两作者间最优关系传递路径,构建作者关系圈;并定期更新作者关系矩阵和作者关系圈。其中两两作者间最优关系传递路径满足条件:两者之间经过的路径绝对值长度最短;在所有最短路径中关系值和最大;经过的最短路径小于6。本发明的作者关系权值模型体现了一篇文章中不同作者的真实关系值,构建的学术关系网更加合理,符合实际作者关系最优值,并实时反映最新的学术关系。 | ||
搜索关键词: | 基于 论文 作者 信息 提取 关系 模型 学术 关系网 构造 方法 | ||
【主权项】:
一种基于论文作者信息提取和关系权值模型的学术关系网构建方法,其特征在于,通过如下步骤实现:步骤1、提取作者信息,构建初始的作者关系矩阵;所述的作者关系矩阵的第i行第j列的元素值为作者i和作者j的关系值,用0表示作者与自己的关系,‑1表示两位作者之间的关系不可达;初始的作者关系矩阵中,对角线上元素值为0,其余位置元素值为‑1;步骤2:建立作者关系权值模型,根据每篇论文的作者信息更新作者关系矩阵;所述的作者关系权值模型为:设一篇论文P,包括通讯作者在内共有N个作者,设作者A和B分别为论文P的第m作者和第n作者,则论文P为作者A与B的关系值贡献的参考值Relation<P,<A,B>>=其中,c为第一作者和通讯作者的关系加强值;x表示作者机构决定的作者关系的权重;当A和B属于同一机构或单位时,参数T的值为1,否则T的值为0;S为由作者次序反映作者关系远近信息的分界值;d表示第一作者和作者次序在S+1位之前的非通讯作者的关系加强值;e表示第一作者和作者次序在S位之后的非通讯作者的关系在关系加强值d基础上的削弱值;所得到的参考值四舍五入到整数;设k篇论文为作者A和B的关系值贡献的参考值分别为r1,r2,…,rk,则作者A和B的关系值为:用得到的关系值更新作者关系矩阵中表示A和B关系值的元素值;步骤3:基于步骤2更新的作者关系矩阵确定两两作者间最优关系传递路径,最优关系传递路径需满足以下几个条件:1)两者之间经过的路径绝对值长度最短;2)在所有最短路径中关系值和最大;3)经过的最短路径小于6;根据最优关系传递路径构建作者关系圈;步骤4、定期更新作者关系矩阵和作者关系圈。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科嘉速(北京)并行软件有限公司,未经中科嘉速(北京)并行软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410395729.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种网页文本摘要生成方法和装置
- 下一篇:事务日志的管理方法和装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置