[发明专利]电子病历处理方法、模型训练方法及相关装置有效
| 申请号: | 201910625921.X | 申请日: | 2019-07-11 |
| 公开(公告)号: | CN110427493B | 公开(公告)日: | 2022-04-08 |
| 发明(设计)人: | 王李鹏 | 申请(专利权)人: | 新华三大数据技术有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N3/04;G06N3/08;G16H50/70;G16H70/20 |
| 代理公司: | 北京超成律师事务所 11646 | 代理人: | 邓超 |
| 地址: | 450000 河南省郑州市高新技*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 电子 病历 处理 方法 模型 训练 相关 装置 | ||
1.一种电子病历处理方法,其特征在于,所述方法包括:
接收电子病历文本,并对所述电子病历文本进行分句,获得所述电子病历文本中包含的多个待识别序列;
将每一所述待识别序列输入至更新模型参数后的序列标注网络模型并进行处理,得到每一所述待识别序列对应的预测实体标注序列,每一预测实体标注序列包含对应的待识别序列中每个词的实体信息,所述实体信息对应疾病、检查、症状和治疗中的一种;
根据所有所述预测实体标注序列,生成所述电子病历文本对应的医学知识图谱;
其中,更新模型参数后的序列标注网络模型是通过以下方式得到的:
获得训练样本序列及所述训练样本序列对应的训练标注结果;
利用语义连接网络对所述训练样本序列进行处理,得到语义标注序列;其中,所述语义连接网络包括M个依次串联的编码模块,每一所述编码模块包括多卷积层、注意力Attention层和第一前馈神经网络层;所述多卷积层、所述Attention层和所述第一前馈神经网络层共同用于对所述训练样本序列进行编码学习得到所述语义标注序列,M为正整数;
将所述语义标注序列作为第二前馈神经网络的输入,经处理后得到所述训练样本序列对应的初始预测结果;
根据概率转移矩阵对所述初始预测结果进行更新,得到所述训练样本序列对应的更新预测结果;
基于所述更新预测结果及所述训练标注结果,更新所述序列标注网络模型的模型参数;
若M为大于1的整数,则利用语义连接网络对所述训练样本序列进行处理,得到语义标注序列的步骤,包括:
将第N个编码模块之前的N-1个编码模块各自的编码输出序列进行合并后得到的集合,作为所述第N个编码模块的编码输入序列并进行处理,得到所述第N个编码模块的编码输出序列;
其中,N小于或等于M,N为大于1的整数,所述M个依次串联的编码模块中第一个编码模块的编码输入序列为所述训练样本序列,且所述M个依次串联的编码模块中所有编码模块各自输出的编码输出序列进行合并后得到的集合,为所述语义标注序列;
若M等于1,则利用语义连接网络对所述训练样本序列进行处理,得到语义标注序列的步骤,包括:
将所述训练样本序列作为所述编码模块的输入并进行处理,得到所述语义标注序列。
2.如权利要求1所述的方法,其特征在于,
所述多卷积层用于对所述编码输入序列进行处理,得到卷积输出序列;
所述Attention层用于对所述卷积输出序列进行处理,并将处理后得到的结果与所述卷积输出序列相加,得到注意力输出序列;
所述第一前馈神经网络层用于对所述注意力输出序列进行处理,并将处理后得到的结果与所述注意力输出序列相加,得到所述编码输出序列。
3.如权利要求2所述的方法,其特征在于,所述多卷积层包括多个依次串联的卷积层,每一卷积层输入的输入序列均为相邻的上一卷积层输出的输出序列;
其中,输入所述多卷积层中第一个卷积层的输入序列为所述编码输入序列,所述卷积输出序列为所述多卷积层中最后一个卷积层输出的输出序列。
4.如权利要求3所述的方法,其特征在于,所述卷积层包括第一归一化层、深度可分离卷积层以及紧缩激励网络SEnet层;
所述第一归一化层用于对所述输入的输入序列进行处理,得到第一归一化输出序列;
所述深度可分离卷积层用于对所述归一化输出序列进行处理,得到分离卷积输出序列;
所述SEnet层用于对所述输入的输入序列进行处理,得到SE输出序列;
其中,所述卷积层输出的输出序列由中间卷积输出序列与所述SE输出序列进行叉乘运算得到;所述中间卷积输出序列为所述分离卷积输出序列与所述输入的输入序列相加得到的序列之和。
5.如权利要求2所述的方法,其特征在于,所述Attention层包括第二归一化层和多头注意力层;
所述第二归一化层用于对所述卷积输出序列进行处理,得到第二归一化输出序列;
所述多头注意力层用于对所述第二归一化输出序列进行处理,得到多头输出序列;其中,所述多头输出序列与所述卷积输出序列相加后得到的序列之和,为所述注意力输出序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华三大数据技术有限公司,未经新华三大数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910625921.X/1.html,转载请声明来源钻瓜专利网。





