[发明专利]基于学科知识图谱集中抽取专家的方法有效
申请号: | 202010474948.6 | 申请日: | 2020-05-29 |
公开(公告)号: | CN111666420B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 林欣;王辰奕;高桢;孙琪力 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33;G06F16/35;G06F40/289 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 学科 知识 图谱 集中 抽取 专家 方法 | ||
本发明公开了一种基于学科知识图谱集中抽取专家的方法,该方法通过应用知识图谱,对单个项目或项目组抽取匹配专家,以便后续对项目组进行多方面的评审。具体包括以下步骤:用英文维基百科超链接的相似度建立关键词到学术知识图谱节点的映射,利用映射结果计算项目组和专家间的匹配程度,利用匹配程度分数为项目组找到相对最为匹配的若干专家,根据本次抽取的整体情况从前一步找到的专家中集中地选择专家作为本次的实际结果,在出现了专家主动或被动退出评审的情况时在保证专家较为集中的前提下为出现空缺的项目组进行填充。本发明灵活易用,适用范围广泛;能够为各行业专家所提出的项目组选择合适的专家,并在不过于损害专家匹配度的前提下,一定程度上保证选出专家的集中性。
技术领域
本发明涉及自然语言处理领域和数据库实体匹配及实体映射领域。具体地说,是一种以学科知识图谱的数据为辅助,批量地对一次评审活动中的若干项目组分别获得若干学科相关程度较高的专家,并从其中尽可能集中地选择专家作为抽取结果的方法。
背景技术
近年,随着硬件性能的提高和互联网上信息的爆炸性增长,对大数据进行处理和分析的方法得到了迅速发展,并在很多领域获得了越来越广泛的应用。而知识图谱作为一种新兴的大数据处理手段,在提高信息检索质量方面有着巨大的优势。
知识图谱的概念由谷歌公司最先提出,在当初,知识图谱主要是用于辅助谷歌的搜索引擎进行信息检索。而随着近年大数据处理和分析方法的发展,知识图谱在智能搜索、智能问答、智能推荐等领域都有了广泛的应用。特别是在智能搜索领域,知识图谱的出现弥补了单纯通过关键词匹配进行搜索的不足,使得搜索引擎可以一定程度上对用户查询的具体意图做出有根据的猜测,实现了概念检索或者语义检索。在知识图谱的支持下,计算机能够更好地对人类语言的表达模式进行理解,为用户智能地反馈更为契合用户需求的检索结果。除此之外,知识图谱的结构特点使得各种信息实体之间的关系能够更清晰地被反映,从而将信息聚合为知识,使信息更容易被计算机理解,评价和利用。
从本质上来说,可以认为知识图谱是一种语义网络,它将现实世界里的各种事物和事物之间的各种关联转化为了更加便于计算机处理的“实体和实体的属性-值”二元组和“实体-关系-实体”三元组的形式。如今,知识图谱的概念得到了泛化,各类大型的知识库也都被称作知识图谱。
发明内容
本发明的目的是提供一种基于学科知识图谱集中抽取专家的方法。该方法使用了微软的学术知识图谱(Microsoft Academic Graph),领域分类的层次结构和英文维基百科(Wikipedia)词条页面之间的相互链接等数据作为抽取任务的辅助。项目组与专家之间学科匹配程度的计算使用了树形结构的路径相似度等方法。
实现本发明目的的具体技术方案是:
一种基于学科知识图谱集中抽取专家的方法,该方法包括以下具体步骤:
步骤1:对针对某次评审活动进行的专家抽取任务,获取本次所有待评审项目组及其各类领域、中英文关键词信息;
步骤2:对所有项目组分别计算与所有专家间的匹配度,获得对每个项目组匹配程度高的专家备选集合;
步骤3:为本次抽取任务中的所有项目组,在保证专家评审的项目组数量不超过本次抽取任务设置的上限的前提下,集中地从所有专家备选集合中选取专家作为最终抽取结果;
步骤4:若有专家在收到参与评审活动的通知后主动或被动退出评审,则集中地为出现空缺的项目组进行补充,使各项目组最终结果中的专家数量重新满足要求。
其中,所述步骤2具体包括:
步骤A1:使用项目组实例里的中、英文关键词集合,为各个关键词寻找与其关联度最高的学术知识图谱节点并建立映射,为每个项目组实例获得其下所有关键词所对应的所有学术知识图谱节点的集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010474948.6/2.html,转载请声明来源钻瓜专利网。