[发明专利]一种临床发现事件的抽取方法及装置在审
申请号: | 202310904583.X | 申请日: | 2023-07-24 |
公开(公告)号: | CN116631642A | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 王实;史鹏涛;张奇 | 申请(专利权)人: | 北京惠每云科技有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06F40/295 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 于彬 |
地址: | 100191 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 临床 发现 事件 抽取 方法 装置 | ||
本申请提供了一种临床发现事件的抽取方法及装置,包括:将获取的目标电子病历输入至预先训练好的事件抽取模型中,由参数共享模块对目标电子病历进行文本向量转化处理,并将确定出的文本向量共享至事件抽取模型中的实体识别模块和关系识别模块;由实体识别模块根据文本向量,确定出目标电子病历的第一实体词预测结果;由关系识别模块根据文本向量,进行实体词关系预测,确定出目标电子病历中医学实体词的第一词关系预测结果;根据以二维矩阵形式表示的第一实体词预测结果和第一词关系预测结果,进行事件抽取处理,得到目标电子病历的临床发现事件。这样,通过本申请的技术方案,可有效的节约内存、缩短推理时间以及提高事件抽取准确率。
技术领域
本申请涉及医疗数据处理技术领域,尤其是涉及一种临床发现事件的抽取方法及装置。
背景技术
随着医院信息化的飞速发展,积累的医疗数据越来越多,其中最基础的医疗数据是电子病历。电子病历包含丰富的医疗数据,其中有部分为非结构化文本数据,文本数据准确的归一化对实现临床决策辅助系统、内涵质控、鉴别诊断等应用的重要的帮助。而临床发现事件抽取为医学文本数据的信息抽取基础任务之一。
针对事件抽取的任务一般而言,会拆分两个任务:一个任务是做命名实体将指定类型的医学实体找出来,另一个任务将找出来的这些医学实体进行关系识别,既实体间是否存在关系。若存在关系挂载在一起组合成临床事件。目前常用事件抽取是使用串行的pipeline方式,先做命名实体任务,然后再做关系识别任务,由于使用pipline方式,会存在两个模型部署到现场,并且两个任务没办法相互提供信息互补,从而存在内存占用大、推理时间长以及事件抽取准确率低的问题。
发明内容
有鉴于此,本申请的目的在于提供一种临床发现事件的抽取方法及装置,可有效的节约内存、缩短推理时间以及提高事件抽取准确率。
本申请实施例提供了一种临床发现事件的抽取方法,所述抽取方法包括:
获取需进行临床发现事件抽取的目标电子病历;
将所述目标电子病历输入至预先训练好的事件抽取模型中,由所述事件抽取模型中的参数共享模块对所述目标电子病历进行文本向量转化处理,确定所述目标电子病历的文本向量,并将所述文本向量共享至所述事件抽取模型中的实体识别模块和关系识别模块;
由所述实体识别模块根据所述文本向量,进行先实体边界预测再实体类型预测处理,确定出所述目标电子病历的第一实体词预测结果;所述第一实体词预测结果包括医学实体词预测结果以及所述医学实体词的词类型预测结果,所述第一实体词预测结果以二维矩阵形式表示;
由所述关系识别模块根据所述文本向量,进行实体词关系预测,确定出所述目标电子病历中医学实体词的第一词关系预测结果;所述第一词关系预测结果以二维矩阵形式表示,所述二维矩阵中标注有存在关系的两医学实体词的首位和尾位;
根据所述第一实体词预测结果和所述第一词关系预测结果,进行事件抽取处理,得到所述目标电子病历的临床发现事件。
可选的,所述根据所述第一实体词预测结果和所述第一词关系预测结果,进行事件抽取处理,得到所述目标电子病历的临床发现事件,包括:
根据所述第一实体词预测结果中的词类型预测结果,确定为预设词类型的目标医学实体词;
根据所述第一词关系预测结果,确定与所述目标医学实体词存在关系的关联医学实体词;
将所述目标医学实体词和所述关联医学实体词从所述目标电子病历中抽取出来,并基于所述第一实体词预测结果对抽取的每个医学实体词添加对应的词类型预测结果,得到所述目标电子病历的临床发现事件。
可选的,通过以下步骤构建所述事件抽取模型:
获取多个添加有真实标签的样本电子病历;所述真实标签包括实体词真实标签和词关系真实标签,所述实体词真实标签和所述词关系真实标签以二维矩阵形式进行表示;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京惠每云科技有限公司,未经北京惠每云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310904583.X/2.html,转载请声明来源钻瓜专利网。