[发明专利]一种层级式病例结构化方法及系统有效
申请号: | 201911056458.8 | 申请日: | 2019-10-31 |
公开(公告)号: | CN111048167B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 孟茜;谢秋景;夏天;刘安庭 | 申请(专利权)人: | 中电药明数据科技(成都)有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G16H15/00;G06F40/211;G06F40/242;G06F40/295;G06F40/30 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 曹鹏飞 |
地址: | 610041 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 层级 病例 结构 方法 系统 | ||
1.一种层级式病例结构化方法,其特征在于,包括:
S10、构建医疗术语层级体系;所述体系中包括:上下位实体、上下位实体对应关系及上下位实体所属类别的定义;下位实体依存于上位实体;
S20、根据所述医疗术语层级体系,通过实体与关系抽取模型,抽取病例文本中的医疗实体、医疗实体关系及属性,生成结构化数据;所述结构化数据包括医疗术语中的上下位实体、上下位实体对应关系及上下位实体所属类别;所述步骤S20具体包括:根据语义对病例文本进行预处理,分为不同语义单元;
在每一个所述语义单元内,通过预设实体模型识别出第一信息;所述第一信息包括医疗术语中的至少一个上位实体及所述上位实体的所属类别;
根据所述层级体系,确定每一个所述上位实体对应的下位实体及下位实体所属类别;
将所述第一信息进行融合生成第一向量,将所述第一向量输入所述预设实体模型,抽取出第二信息;所述第二信息包括医疗术语中的下位实体及所述下位实体的所属类别;
根据自注意力关系抽取模型,区分所述语义单元内多个上位实体分别与多个下位实体是否存在依存关系,完成抽取病例文本中的结构化数据;
S30、将所述结构化数据与数据仓库中预设的标准化医疗术语数据模板进行比对,并通过句法分析算法及知识图谱进行语义维度数据质量检测,生成与所述结构化数据对应的质量级别;
S40、将所述结构化数据及对应的质量级别,存储入所述数据仓库。
2.如权利要求1所述的一种层级式病例结构化方法,其特征在于,所述步骤S10,包括:根据医学相关词典或医疗知识图谱,结合预设病例的结构化需求,进行定义层级体系的上下位实体、上下位实体间的关系及上下位实体所属类别;所述上位实体表示疾病名称、药品名称、症状名称;所述下位实体为上位实体的相关信息,所述相关信息包括下述任一项或多项:部位、持续时间、次数、程度和病因。
3.如权利要求1所述的一种层级式病例结构化方法,其特征在于,在所述将所述结构化数据及对应的质量级别,存储入所述数据仓库之前,所述方法还包括:
S35、获取人工校验后的所述结构化数据及所述结构化数据对应的质量级别。
4.如权利要求3所述的一种层级式病例结构化方法,其特征在于,还包括:当所述预设实体模型为神经网络模型时,将人工校验后的所述结构化数据,加入所述神经网络模型的训练集。
5.一种层级式病例结构化系统,其特征在于,包括:
构建模块,用于构建医疗术语层级体系;所述体系中包括:上下位实体、上下位实体对应关系及上下位实体所属类别的定义;下位实体依存于上位实体;
实体与关系抽取模块,用于根据所述医疗术语层级体系,通过实体与关系抽取模型,抽取病例文本中的医疗实体、医疗实体关系及属性,生成结构化数据;所述结构化数据包括医疗术语中的上下位实体、上下位实体对应关系及上下位实体所属类别;所述实体与关系抽取模块具体包括:
预处理单元,用于根据语义对病例文本进行预处理,分为不同语义单元;
识别单元,用于在每一个所述语义单元内,通过预设实体模型识别出第一信息;所述第一信息包括医疗术语中的至少一个上位实体及所述上位实体的所属类别;
确定单元,用于根据所述层级体系,确定至少一个所述上位实体对应的下位实体及下位实体所属类别;
抽取单元,用于将所述第一信息进行融合生成第一向量,将所述第一向量输入所述预设实体模型,抽取出第二信息;所述第二信息包括医疗术语中的下位实体及所述下位实体的所属类别;
区分单元,用于根据自注意力关系抽取模型,区分所述语义单元内多个上位实体分别与多个下位实体是否存在依存关系,完成抽取病例文本中的结构化数据;
数据质量检测模块,用于将所述结构化数据与数据仓库中预设的标准化医疗术语数据模板进行比对,并通过句法分析算法及知识图谱进行语义维度数据质量检测,生成与所述结构化数据对应的质量级别;
存储模块,用于将所述结构化数据及对应的质量级别,存储入所述数据仓库。
6.如权利要求5所述的一种层级式病例结构化系统,其特征在于,所述构建模块,具体用于根据医学相关词典或医疗知识图谱,结合预设病例的结构化需求,进行定义层级体系的上下位实体、上下位实体间的关系及上下位实体所属类别;所述下位实体依存于所述上位实体;所述上位实体表示疾病名称、药品名称、症状名称;所述下位实体为上位实体的相关信息,所述相关信息包括下述任一项或多项:部位、持续时间、次数、程度和病因。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电药明数据科技(成都)有限公司,未经中电药明数据科技(成都)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911056458.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:游戏辅助方法、装置及存储介质
- 下一篇:一种导航方法、装置及车载设备