[发明专利]一种医疗术语抽取方法及装置有效
申请号: | 201711448103.4 | 申请日: | 2017-12-27 |
公开(公告)号: | CN108170677B | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 孟庆伟;胡可云;陈联忠 | 申请(专利权)人: | 北京嘉和海森健康科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G16H50/20 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种医疗术语抽取方法及装置,在获取目标电子病历中的自由文本后,可以利用预先建立的信息抽取模型对所述自由文本进行信息抽取,获取所述信息抽取模型所抽取到的医疗术语集合;然后,由于某些医疗术语之间预先定义了承接关系,因此,在所述医疗术语集合中,为预先定义有承接关系的每组医疗术语建立对应的承接关系。这样,可以使抽取出的医疗术语之间的承接关系得以体现,从而可以根据预定义属性对抽取出的医疗术语进行准确地归类,避免了抽取结果存在偏差,从而提高了医疗术语抽取结果的准确性,进而可以满足医生对自由文本处理结果的需求。 | ||
搜索关键词: | 一种 医疗 术语 抽取 方法 装置 | ||
获取目标电子病历中的自由文本;
利用预先建立的信息抽取模型对所述自由文本进行信息抽取,其中,所述信息抽取模型包括至少两个属性模型,所述属性模型用于抽取与预定义属性相关的至少一个信息点对应的医疗术语;
获取所述信息抽取模型所抽取到的医疗术语集合;
若所述医疗术语集合中存在至少一组医疗术语且每组医疗术语中的各个医疗术语之间预先定义了承接关系,则建立所述每组医疗术语中的各个医疗术语之间的承接关系,其中,所述每组医疗术语包括至少两个医疗术语。
2.根据权利要求1所述的方法,其特征在于,当所述目标电子病历包括至少一个文书文档、且所述文书文档包括至少一个文档章节时,所述信息抽取模型还包括用于对所述文档章节进行信息抽取的章节模型;则,所述利用预先建立的信息抽取模型对所述自由文本进行信息抽取,包括:
将所述目标电子病历中的每一文档章节作为目标章节;
调用所述目标章节对应的章节模型,使被调用章节模型调用所述至少两个属性模型中的属性模型,对所述自由文本中属于所述目标章节的文本信息进行信息抽取。
3.根据权利要求2所述的方法,其特征在于,所述对所述自由文本中属于所述目标章节的文本信息进行信息抽取,包括:对于所述自由文本中属于所述目标章节的文本信息,按照书写主线进行信息抽取。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:根据不同模式的电子病历对文档章节的划分结果,建立每种模式的电子病历与对应文档章节的章节模型之间的第一对应关系;
则,所述调用所述目标章节对应的章节模型,包括:
根据所述第一对应关系,调用所述目标章节对应的章节模型。
5.根据权利要求2至4任一项所述的方法,其特征在于,所述方法还包括:预先统计所述预定义属性所出现过的至少一个文档章节;
建立所述预定义属性对应的属性模型与所述至少一个文档章节对应的章节模型之间的第二对应关系;
则,所述使被调用章节模型调用所述至少两个属性模型中的属性模型,包括:
根据所述第二对应关系,使被调用章节模型调用所述至少两个属性模型中的属性模型。
6.根据权利要求2至4任一项所述的方法,其特征在于,所述章节模型对应于至少一个文书文档;所述方法还包括:预先统计所述文档章节所出现过的至少一个文书文档;
建立所述文档章节对应的章节模型与所述至少一个文书文档之间的第三对应关系;
则,所述调用所述目标章节对应的章节模型,包括:
根据所述第三对应关系,调用所述目标章节对应的章节模型。
7.一种医疗术语抽取装置,其特征在于,包括:文本获取单元,用于获取目标电子病历中的自由文本;
信息抽取单元,用于利用预先建立的信息抽取模型对所述自由文本进行信息抽取,其中,所述信息抽取模型包括至少两个属性模型,所述属性模型用于抽取与预定义属性相关的至少一个信息点对应的医疗术语;
集合获取单元,用于获取所述信息抽取模型所抽取到的医疗术语集合;
第一建立单元,用于若所述医疗术语集合中存在至少一组医疗术语且每组医疗术语中的各个医疗术语之间预先定义了承接关系,则建立所述每组医疗术语中的各个医疗术语之间的承接关系,其中,所述每组医疗术语包括至少两个医疗术语。
8.根据权利要求7所述的装置,其特征在于,当所述目标电子病历包括至少一个文书文档、且所述文书文档包括至少一个文档章节时,所述信息抽取模型还包括用于对所述文档章节进行信息抽取的章节模型;则,所述信息抽取单元,包括:
目标章节确定子单元,用于将所述目标电子病历中的每一文档章节作为目标章节;
章节模型调用子单元,用于调用所述目标章节对应的章节模型;
文本信息抽取子单元,用于使被调用章节模型调用所述至少两个属性模型中的属性模型,对所述自由文本中属于所述目标章节的文本信息进行信息抽取。
9.根据权利要求8所述的装置,其特征在于,所述文本信息抽取子单元,具体用于对于所述自由文本中属于所述目标章节的文本信息,按照书写主线进行信息抽取。10.根据权利要求8所述的装置,其特征在于,所述装置还包括:第二建立单元,用于根据不同模式的电子病历对文档章节的划分结果,建立每种模式的电子病历与对应文档章节的章节模型之间的第一对应关系;
则,所述章节模型调用子单元,具体用于根据所述第一对应关系,调用所述目标章节对应的章节模型。
11.根据权利要求8至10任一项所述的装置,其特征在于,所述装置还包括:第一统计单元,用于预先统计所述预定义属性所出现过的至少一个文档章节;
第三建立单元,用于建立所述预定义属性对应的属性模型与所述至少一个文档章节对应的章节模型之间的第二对应关系;
则,所述文本信息抽取子单元,具体用于根据所述第二对应关系,使被调用章节模型调用所述至少两个属性模型中的属性模型。
12.根据权利要求8至10任一项所述的装置,其特征在于,所述章节模型对应于至少一个文书文档;所述装置还包括:第二统计单元,用于预先统计所述文档章节所出现过的至少一个文书文档;
第四建立单元,用于建立所述文档章节对应的章节模型与所述至少一个文书文档之间的第三对应关系;
则,所述章节模型调用子单元,具体用于根据所述第三对应关系,调用所述目标章节对应的章节模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘉和海森健康科技有限公司,未经北京嘉和海森健康科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711448103.4/,转载请声明来源钻瓜专利网。
- 上一篇:故事创作的方法、系统和终端
- 下一篇:一种文本实体抽取方法与系统