[发明专利]一种基于多层语义分析的医疗信息提取方法有效

专利信息
申请号: 201811347337.4 申请日: 2018-11-13
公开(公告)号: CN111180076B 公开(公告)日: 2023-09-05
发明(设计)人: 阮耀平;汤若云;罗翔凤;张天泽 申请(专利权)人: 零氪科技(北京)有限公司
主分类号: G16H50/70 分类号: G16H50/70
代理公司: 北京华夏正合知识产权代理事务所(普通合伙) 11017 代理人: 韩登营
地址: 100080 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 多层 语义 分析 医疗 信息 提取 方法
【说明书】:

本发明提供了一种基于多层语义分析的医疗信息提取方法,该方法包括训练过程和提取过程,具体包括以下步骤:A、获取多层标注数据;B、将多层标注数据进行分层处理,并将分层后的数据派发到所属事件层;C、利用每层标注数据训练该层对应的事件层的模型;D、利用训练好的模型树将病历文本从第一事件层逐层提取数据,并依次向上一事件层输出提取的数据;E、将最高事件层提取的数据作为提取结果,得到医疗信息。本发明不依赖于现有方法中对谓词的使用,并且由于多层嵌套的设计拥有较优的泛化能力,从相似的病历文本中提取结构化信息所需要的标注量相比于传统的模式匹配大大降低。

技术领域

本发明涉及智慧医疗技术领域,特别涉及一种基于多层语义分析的医疗信息提取方法。

背景技术

随着信息化在医院中的普及,大量病历数据以电子病历的形式存储在医院的HIS(Hospital Information System,HIS)系统中,并且利用以电子病历数据为代表的临床医疗数据来辅助医疗诊断以及建立用户健康信息模型已经成为了医疗信息学的发展的方向。然而,由于我国研究起步较晚,且存储的电子病历数据多数是未结构化的文本,具有自然语言表达较灵活,以及包含众多的专业术语等特点,进行电子病历的信息抽取研究有一定的难度,使得其中包含的重要医疗信息无法被用于信息检索。

当前,事件抽取技术经常被用于从文本中提取结构化数据,其中,基于模式匹配和基于机器学习的事件提取技术,已经在医疗领域,尤其是基因表达方向取得了较为广泛的使用。基于模式匹配的方法可以获取较高性能,但是当前主要使用谓词作为事件触发词,而在中文医学领域中,电子病历的写法通常是比较有限的,电子病历中普遍缺少带有强烈事件特征的谓词,使得当前基于谓词的模式匹配方法较难直接应用,移植性较差。基于机器学习的方法尽管移植性较好,但是需要大量标注语料,而电子病历的语料在标注时需要大量的专业领域知识,标注语料的构建存在着较大困难,因此表现较为一般。有鉴于此,本专利提供了一种可以从病历文本中提取结构化医疗信息的,基于多层语义分析的方法。

发明内容

有鉴于此,本发明的主要目的在于提供一种基于多层语义分析的医疗信息提取方法,本方法不依赖于谓词的使用,并且由于多层嵌套的设计拥有较优的泛化能力,从相似的病历文本中提取结构化信息所需要的标注量相比于传统的模式匹配大大降低。

本发明采用的技术方案为,一种基于多层语义分析的医疗信息提取方法,该方法通过多层标注数据训练模型并利用训练好的模型提取病历文本中的医疗信息,具体包括以下步骤:

A、通过标注端获取多层标注数据;

B、将多层标注数据进行分层处理,并将分层后的数据派发到所属事件层;

C、利用每层标注数据训练该层对应的事件层的模型;

D、利用训练好的模型树将病历文本从第一事件层逐层提取数据,并依次向上一事件层输出提取的数据;

E、将最高事件层提取的数据作为提取结果,得到医疗信息。

由上,本方法基于现有事件标注方法进行改进,将传统的谓词标注改成整个事件的文本标注,并将医疗文本进行分层,形成多个事件并对多个事件进行嵌套标注,形成多层标注数据。训练过程中,首先将多层标注数据逐层拆分,然后分层派发给每层的模型各自进行训练,组成一套完整的模型树。提取过程中,将待提取的医疗文本按照模型树从第一层开始,进行逐层提取,每层输出的提取数据,包括事件提取的结果和原始待提取的文本,作为下一层事件的输入数据,最后一层输出的数据作为提取完成的医疗信息返回给使用方。本方法不依赖于谓词的使用,并且由于多层嵌套的设计拥有较优的泛化能力,从相似的病历文本中提取结构化信息所需要的标注量相比于传统的模式匹配大大降低。

其中,步骤A所述的多层标注数据包括在文本中标注实体、事件、关系和属性,并将所述事件涉及到的文本都标注为事件;

其中,标注实体的文本为第一层标注,且每一个实体标注内不包含其他实体或事件。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于零氪科技(北京)有限公司,未经零氪科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811347337.4/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top