[发明专利]一种医疗术语抽取方法及装置有效
申请号: | 201711448103.4 | 申请日: | 2017-12-27 |
公开(公告)号: | CN108170677B | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 孟庆伟;胡可云;陈联忠 | 申请(专利权)人: | 北京嘉和海森健康科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G16H50/20 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 医疗 术语 抽取 方法 装置 | ||
本申请公开了一种医疗术语抽取方法及装置,在获取目标电子病历中的自由文本后,可以利用预先建立的信息抽取模型对所述自由文本进行信息抽取,获取所述信息抽取模型所抽取到的医疗术语集合;然后,由于某些医疗术语之间预先定义了承接关系,因此,在所述医疗术语集合中,为预先定义有承接关系的每组医疗术语建立对应的承接关系。这样,可以使抽取出的医疗术语之间的承接关系得以体现,从而可以根据预定义属性对抽取出的医疗术语进行准确地归类,避免了抽取结果存在偏差,从而提高了医疗术语抽取结果的准确性,进而可以满足医生对自由文本处理结果的需求。
技术领域
本申请涉及计算机技术领域,尤其涉及一种医疗术语抽取方法及装置。
背景技术
病历包括门(急)诊病历和住院病历,病历是医务人员对患者疾病的发生、发展、转归,进行检查、诊断、治疗等医疗活动过程的记录,也是对采集到的资料加以归纳、整理、综合分析,按规定的格式和要求书写的患者医疗健康档案。病历既是临床实践工作的总结,又是探索疾病规律及处理医疗纠纷的法律依据,病历对医疗、预防、教学、科研、医院管理等都有重要的作用。
电子病历也叫计算机化的病案系统或称基于计算机的病人记录。它是用电子设备(计算机、健康卡等)保存、管理、传输和重现的数字化的病人的医疗记录,取代手写纸张病历,它的内容包括纸张病历的所有信息。美国国立医学研究所将其定义为:电子病历是基于一个特定系统的电子化病人记录,该系统提供用户访问完整准确的数据、警示、提示和临床决策支持系统的能力。
把电子病历文本里包含的信息通过信息抽取技术进行结构化处理,变成表格一样的组织形式。信息抽取系统中输入的是原始电子病历文本,输出的是固定格式的信息点。信息点从各种各样的文本中被抽取出来,然后以统一的形式集成在一起,这就是信息抽取的主要任务。信息以统一的形式集成在一起的好处是方便检查和比较,通过抽取后的信息点进行大数据分析和机器学习,满足医疗工作者在科研工作中对某些指标的需要,比如,需要统计2015年至2017年以胸痛为主要症状入院的心绞痛患者在所有心绞痛患者之间的发病概率。
随着医疗工作者科研水平的提高,对信息点的要求也越来越细,多层次的进行医疗术语的抽取越来越成为需求的必要。目前,医疗文本的信息抽取,多采用字典匹配及正则表达式抽取。
字典匹配即建立不同属性的字典,通过字典中词语的具体属性来确定文本中词语的类型,如“流行性感冒”是一个疾病词语,通过疾病字典的匹配,计算机可以知道“流行性感冒”是疾病范畴的词语,进而可以正确的分词。
正则表达式是通过建立不同的类,通过分析与类相关的字节,使相应的字节为这个类的属性,如医学文本中的“肺部可及湿啰音”,表达的是通过医生听诊,可以在患者的肺部听到“湿啰音”,正则表达式的输出结果及“湿啰音”这个类的部位属性为:肺部,标志位的属性为“是”(可及的意思,不同的文义中,意思相同的表达输出为标准的一种结构)。
自由文本通过字典匹配或正则表达式能输出简单的逻辑关系,但医学上的表达逻辑相对来说更为复杂,如咳嗽和咳痰的关系,按照医学字典匹配,这两者均为症状,但咳嗽为咳痰的前提,有咳痰肯定有咳嗽,反之则不然。通过词典和正则表达式的匹配也不能解决医学上一些词语属性的归类问题,如肿瘤患者化疗后会出现恶心、呕吐、腹泻等症状,如果单纯的通过字典匹配,则抽取结果会有偏差,且解决不了医生对自由文本处理结果的需求。
发明内容
有鉴于此,本申请实施例的主要目的在于提供一种医疗术语抽取方法及装置,能够提高医疗术语抽取结果的准确性。
第一方面,本申请提供了一种医疗术语抽取方法,包括:
获取目标电子病历中的自由文本;
利用预先建立的信息抽取模型对所述自由文本进行信息抽取,其中,所述信息抽取模型包括至少两个属性模型,所述属性模型用于抽取与预定义属性相关的至少一个信息点对应的医疗术语;
获取所述信息抽取模型所抽取到的医疗术语集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘉和海森健康科技有限公司,未经北京嘉和海森健康科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711448103.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:故事创作的方法、系统和终端
- 下一篇:一种文本实体抽取方法与系统