[发明专利]病案标化方法、系统及相应设备和存储介质在审
| 申请号: | 202111536210.9 | 申请日: | 2021-12-15 | 
| 公开(公告)号: | CN114446422A | 公开(公告)日: | 2022-05-06 | 
| 发明(设计)人: | 赵建强;王梦迪 | 申请(专利权)人: | 望海康信(北京)科技股份公司 | 
| 主分类号: | G16H10/60 | 分类号: | G16H10/60;G06F40/30;G06F40/194;G06F16/36 | 
| 代理公司: | 北京金阙华进专利事务所(普通合伙) 11224 | 代理人: | 陈建春 | 
| 地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 病案 方法 系统 相应 设备 存储 介质 | ||
1.一种病案标化方法,其特征在于,所述方法包括:
提取病案信息中的诊断词;
对于每一诊断词,计算其与所有标准词的相关性分数,根据相关性分数的排序召回预定数量的最相关的标准词;
计算每一诊断词与每一相应召回的标准词的文本相似度;
将文本相似度大于或等于预定阈值的诊断词及相应的标准词两两输入经训练的语义相似度模型并进行语义相似度排序;
选取语义相似度最高的标准词作为相应诊断词的标准诊断词。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将文本相似度小于预定阈值的诊断词输入经训练的医学实体识别模型以识别相应诊断词中的医学实体;
基于预先构建的知识图谱,根据所识别的医学实体从知识图谱召回对应的标准词;
将文本相似度小于预定阈值的诊断词及从知识图谱召回的标准词两两输入经训练的语义相似度模型并进行语义相似度排序。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据一个或多个所述标准诊断词确定病案的ICD编码。
4.根据权利要求1所述的方法,其特征在于,所述相关性分数使用BM25算法进行计算。
5.根据权利要求1所述的方法,其特征在于,所述文本相似度为编辑距离。
6.根据权利要求1所述的方法,其特征在于,所述经训练的语义相似度模型为经训练的BERT模型。
7.根据权利要求1所述的方法,其特征在于,所述经训练的医学实体识别模型为使用标注医学实体的数据训练的BERT模型。
8.一种病案标化系统,其特征在于,所述系统包括:
诊断词提取模块,用于提取病案信息中的诊断词;
相关标准词召回模块,用于对于每一诊断词,计算其与所有标准词的相关性分数,根据相关性分数的排序召回预定数量的最相关的标准词;
文本相似度计算模块,用于计算每一诊断词与每一相应召回的标准词的文本相似度;
语义相似度排序模块,用于将文本相似度大于或等于预定阈值的诊断词及相应的标准词两两输入经训练的语义相似度模型并进行语义相似度排序;
标准词选取模块,用于选取语义相似度最高的标准词作为相应诊断词的标准诊断词。
9.一种计算机设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中所述处理器执行所述计算机程序时实现根据权利要求1-7任一所述的方法的步骤或者根据权利要求8所述的系统的功能。
10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现根据权利要求1-7任一所述的方法的步骤或者根据权利要求8所述的系统的功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于望海康信(北京)科技股份公司,未经望海康信(北京)科技股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111536210.9/1.html,转载请声明来源钻瓜专利网。





