[发明专利]中文电子病历手术操作文本的ICD自动编码方法及装置在审
申请号: | 202111373822.0 | 申请日: | 2021-11-19 |
公开(公告)号: | CN114065744A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 傅湘玲;高越;闫晨巍 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F40/258 | 分类号: | G06F40/258;G06F40/30;G06N3/02;G06N3/08;G16H10/60;G06F16/35;G06F16/33 |
代理公司: | 北京格允知识产权代理有限公司 11609 | 代理人: | 张莉瑜 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中文 电子 病历 手术 操作 文本 icd 自动 编码 方法 装置 | ||
1.一种中文电子病历手术操作文本的ICD自动编码方法,其特征在于,包括:
以结构化电子病历中的手术操作文本作为输入,基于BERT无监督预训练模型,构建包含无监督上下文语义信息的节点与边,得到每条手术操作文本的无监督语义图;其中,所述无监督语义图的节点包括章节级节点、文档级节点和最多四个轴心词节点;所述章节级节点的特征向量包含手术操作文本所属章节的上下文语义信息,所述文档级节点的特征向量包含整条手术操作文本的上下文语义信息,四个所述轴心词节点的特征向量分别包含手术操作的部位、术式、入路和疾病性质四个轴心词语义信息,所述无监督语义图的边的权重包含所连两节点之间在手术操作文本中的的语义影响力信息;
将构建的所述无监督语义图输入门控图神经网络,进行全局信息交互,得到语义信息融合的语义图;
基于得到的语义信息融合的语义图,聚合各节点的表征,得到聚合的特征向量;
根据聚合的特征向量进行分类,确定所述手术操作文本对应的ICD编码。
2.根据权利要求1所述的方法,其特征在于,所述基于BERT无监督预训练模型,构建包含无监督上下文语义信息的节点,包括:
将所述手术操作文本输入第一BERT模型,查找所述手术操作文本对应的编码章节,确定章节标题文本;所述第一BERT模型包括BERT无监督预训练模型和softmax层;
将所述章节标题文本输入第二BERT模型,以[CLS]字符的表征作为所述章节级节点的初始特征向量;
将所述手术操作文本输入命名实体识别模型,分别提取部位、术式、入路和疾病性质四个轴心词的词组,确定各轴心词的词组位置;
将所述手术操作文本输入第二BERT模型,以[CLS]字符的表征作为所述文档级节点的初始特征向量,分别以各轴心词词组所涉及字符的表征的平均值,作为相应轴心词节点的初始特征向量。
3.根据权利要求2所述的方法,其特征在于,所述基于BERT无监督预训练模型,构建包含无监督上下文语义信息的边,包括:
计算每两个所述轴心词节点之间有指向性的影响力关系;
计算各所述轴心词节点与所述文档级节点之间有指向性的影响力关系;
计算所述章节级节点与所述文档级节点之间有指向性的影响力关系;
基于影响力关系构造影响力矩阵,利用激活函数将构造的所述影响力矩阵转换为归一化的邻接矩阵,确定所述无监督语义图中各边的权重。
4.根据权利要求3所述的方法,其特征在于,计算两个所述轴心词节点之间有指向性的影响力关系,包括:
设两个轴心词节点分别为第一轴心词节点和第二轴心词节点,用[MASK]字符遮挡所述手术操作文本中第一轴心词节点对应的词组,输入第二BERT模型,得到该第一轴心词节点对应的词组所涉及字符的表征的平均值,作为第一平均值;
用[MASK]字符遮挡所述手术操作文本中第一轴心词节点和第二轴心词节点对应的词组,输入第二BERT模型,得到该第一轴心词节点对应的词组所涉及字符的表征的平均值,作为第二平均值;
基于欧几里得距离,计算所述第一平均值与所述第二平均值之间的差异,作为第二轴心词节点对第一轴心词节点的影响力权重。
5.根据权利要求3所述的方法,其特征在于,计算所述轴心词节点与所述文档级节点之间有指向性的影响力关系,包括:
用[MASK]字符遮挡所述手术操作文本中该轴心词节点对应的词组,输入第二BERT模型,以[CLS]字符的表征作为第二文档参量,以该轴心词节点对应的词组所涉及字符的表征的平均值,作为第二轴心词参量;
以所述文档级节点的初始特征向量作为第一文档参量,基于欧几里得距离,计算所述第一文档参量与所述第二文档参量之间的差异,作为该轴心词节点对所述文档级节点的影响力权重;
以该轴心词节点的初始特征向量作为第一轴心词参量,基于欧几里得距离,计算所述第一轴心词参量与所述第二轴心词参量之间的差异,作为所述文档级节点对该轴心词节点的影响力权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111373822.0/1.html,转载请声明来源钻瓜专利网。