[发明专利]一种处理文献信息的方法有效

专利信息
申请号: 201710613510.X 申请日: 2017-07-25
公开(公告)号: CN107391690B 公开(公告)日: 2020-03-31
发明(设计)人: 李小明;李大明;杜鸣笛 申请(专利权)人: 李小明
主分类号: G06F16/31 分类号: G06F16/31;G06F16/35;G06F16/33;G06F40/289;G06F40/30
代理公司: 北京知呱呱知识产权代理有限公司 11577 代理人: 吕学文;朱红涛
地址: 231400 安徽省*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 处理 文献 信息 方法
【说明书】:

本申请涉及一种处理文献信息的方法,所述方法包括:获取文献的核心关键词,并对获取的核心关键词进行同类聚集;构建单篇文献中核心关键词之间的逻辑结构关系,并形成所有核心关键词在不同文献之间的逻辑互联体系;建立核心关键词与关联网状节点信息以及对应文献之间的索引;根据用户输入的关注核心关键词,查询并展示所述关注核心关键词对应的直接关联信息和间接关联信息。本发明提供的技术方案,能够提高文献的使用效率。

技术领域

本申请涉及数据处理技术领域,特别涉及一种处理文献信息的方法。

背景技术

科学技术的创新是推动社会各行各业发展和变革进程的原动力。一方面,科学研究是一项复杂而多样性的活动,其中唯一贯穿所有领域且最重要的一环是来源于大量学术文献的查阅与利用。因为无论是任何创新问题的提出还是解决思路的获取,都离不开对以往科研成果(主要指科研文献)的直接或间接借鉴与启发。另一方面,学术文献为科技创新的服务主要受限于以下两个因素:科研者利用文献的效率与科研文献本身价值的利用率,即如何高效精准获取有价值的文献信息和如何利用已有的文献数据挖掘出更多具有学术价值的创新思想和启发。因此,研究新的数据处理技术来使得现有的文献数据更好更高效地为科研者服务,对个人及社会都具有重大的现实意义。

在应用层,目前的文献系统和数据库均只能检索出包含有与输入关键词字面上相同或相似的文献,而无法对文章的核心思想以及其与输入关键词之间的关系做出准确的理解和判断。首先,对一篇检索出的文献来说,虽然包含有与输入关键词相关的表述,但是该文献的核心思想与价值却可能与此关键词关联不大,甚至毫无关系,导致了检索结果的大量杂质化。其次,即使输入的关键词是表达该文献中心思想的一个核心元素,但是围绕该关键词的所有核心信息均不能完全符合或满足用户的价值需求,这是信息片面化的一个重要表现。最后,由于信息来源的多样化,同时又不能对信息的语义做出准确的分析,导致检索结果中出现很多类似甚至完全相同的信息,产生了大量冗余。对科研者来说,往往只有对检索出的大量文献信息进行全方位系统的甄别与调研以后才能提出(发现)有价值的科学问题或相关问题的解决方案。然而信息的冗余、片面和杂质等问题,使得科研者利用文献数据产生创新思想的效率受到了极大的限制。另外,鉴于目前的数据存储与处理技术,应用层中的任何一个算法也无法通过计算机从现有的大量科研文献中挖掘出具有价值的潜在学术问题或创新启发,严重制约了文献数据的利用价值。

发明内容

本发明的目的在于提供一种处理文献信息的方法,能够提高文献的使用效率。

为实现上述目的,本申请提供一种处理文献信息的方法,所述方法包括:获取文献的核心关键词,并对获取的核心关键词进行同类聚集;构建单篇文献中核心关键词之间的逻辑结构关系,并形成所有核心关键词在不同文献之间的逻辑互联体系;建立核心关键词与关联网状节点信息以及对应文献之间的索引;根据用户输入的关注核心关键词,查询并展示所述关注核心关键词对应的直接关联信息和间接关联信息。

进一步地,所述获取文献的核心关键词包括:采集文献的原始信息,并把每一篇文献中包含实际含义的字、词和短语提取出来,形成每篇文献涉及的关键词;针对每篇文献,将采集的关键词与文献的主题进行对比,并将符合文献主题的关键词作为核心关键词。

进一步地,对获取的核心关键词进行同类聚集包括:将所有文献中相似度高于指定阈值的核心关键词聚集到同一类关键词中,形成同类关键词集合;其中,每个所述同类关键词集合中的核心关键词之间均存在直接的对应关系;标记并存储所述同类关键词集合以及各个同类关键词集合内核心关键词之间的对应关系,以扩大查询及关联范围;其中,同一关键词对应的不同词性、不同时态、不同语态的所有关键词都属于同一关键词。

进一步地,所述相似度高于指定阈值的核心关键词包括:语义相同但表达不同的核心关键词;和/或字面含义之间的关联度高于指定阈值的核心关键词。

进一步地,构建单篇文献中核心关键词之间的逻辑结构关系包括:对核心关键词的整体逻辑结构进行划分;在同层级核心关键词间建立逻辑关系。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于李小明,未经李小明许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710613510.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top