[发明专利]一种生物医学实体关系的文献检索系统及检索方法在审

专利信息
申请号: 201910027427.3 申请日: 2019-01-11
公开(公告)号: CN109857731A 公开(公告)日: 2019-06-07
发明(设计)人: 白天;葛岩;姚刚;杨昌青;宫雷光;李颖;黄岚 申请(专利权)人: 吉林大学
主分类号: G06F16/215 分类号: G06F16/215;G06F16/248
代理公司: 吉林长春新纪元专利代理有限责任公司 22100 代理人: 陈宏伟
地址: 130011 吉*** 国省代码: 吉林;22
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 生物医学 实体关系 文献检索系统 检索 可视化 数据库 数据库整合 返回结果 结构组织 列表形式 用户检索 清晰
【说明书】:

发明公开一种生物医学实体关系的文献检索系统及检索方法,把多个涉及到不同类型的生物医学实体以及实体关系的数据库整合成一个数据库,将数据库中的部分数据用图的结构组织起来,提供检索任意两个实体之间的直接的以及间接的关系,并通过可视化的形式展现出来。能够减少用户检索的时间并且能够提供清晰明了的可视化返回结果,而不是冗长的列表形式。

技术领域

本发明公开一种生物医学实体关系的文献检索系统及检索方法,能够减少用户检索的时间,并提供清晰明了的可视化返回结果,而不是冗长的列表形式。在检索生物医学实体和关系方面更有效、更直观,属于计算机网络文献检索技术领域。

背景技术

近年来,大量的生物医学实验结果和发现通过学术论文的形式被报道出来,这些结果和发现也同时被整合收录到各种生物医学数据库中,此外,多年来人们总结的各种生物医学知识如医学教科书、临床标准、疾病本体等也可以从网络上大量的获取,这些知识中的很大一部分的实质是描述生物医学实体之间的关系。目前,已经有一些数据库和工具能够检索生物医学实体之间的关系,比如,Poon等人开发了Literome,它可以搜索两种与基因组医学最密切相关的知识:(1)基因间的直接关系,如pathways和genotype–phenotype关系(2)两个实体之间的间接关系,比如疾病和基因可能是相互联系的,因为疾病与相互作用的基因有关;Jeon等人开发了BEReX,用户可以通过它找到两个距离较远的节点之间的最短路径,并通过这个网络来找到的最相关的疾病、药物、路径等,利用特定类型的实体和关系来扩展当前的网络,BEReX还允许用户通过添加或删除选定的节点来修改网络;Lee等人开发了HiPub,这是一个Chrome浏览器插件,它可以从文本中提取生物医学实体关系,从外部数据库中整合现有生物医学网络数据进行知识发现。但是这些检索工具面临的问题是数据库大部都是仅仅研究单个或者几个医学实体,知识量大但是分散化存储,很难让研究人员能够对生物医学实体间接之间的关系有一个全局的认识。而本发明提出了一种整合的、面向关系的、可视化的生物医学实体关系的文献检索系统及检索方法,减少了研究人员获取知识的时间成本。

发明内容

本发明提出了一种生物医学实体关系的文献检索方法,把多个涉及到不同类型的生物医学实体以及实体关系的数据库整合成一个数据库,将数据库中的部分数据用图的结构组织起来,提供检索任意两个实体之间的直接的以及间接的关系,并通过可视化的形式展现出来。

本发明所述的一种生物医学实体关系的文献检索系统及检索方法,其技术解决方案如下:

1、一种生物医学实体关系的文献检索系统,组成如下:

(一)数据库融合

对同一个生物医学实体在不同的数据库中的不同名称统一实体名称:

采用NCBI基因符号作为gene/protein的代表名称,采用MeSH词汇作为disease,chemical的代表名称,采用KEGG的pathway名字作为pathway的代表名称,采用geneontology的名称作为GO的名称;

使用实体的名称及其同义词构建一个词库,词库中存放了实体的ID,Name以及Type属性,用Type属性将不同类型的实体标识出来,通过ID,name以及synonyms进行快速检索;

(1)数据清洗

将csv、xml、owl、txt等格式的文本数据读入在PC端构建的数据库中,并对不合法数据进行清理:

数据分为实体和实体关系两种类型:

实体:包含id,name,symbol,definition,xref,synonyms,parentId,isParent等属性;对存在继承关系(is-a)的实体更新isParent属性,来判断当前节点是否包含子节点;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910027427.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top