[发明专利]疾病名称的编码方法、装置、设备及存储介质在审
申请号: | 202210151142.2 | 申请日: | 2022-02-14 |
公开(公告)号: | CN114512207A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 李本文;肖松;李德春;张鑫;谢丽凤 | 申请(专利权)人: | 深圳市方迪融信科技有限公司 |
主分类号: | G16H10/00 | 分类号: | G16H10/00;G06N3/04;G06N3/08 |
代理公司: | 广东灵顿知识产权代理事务所(普通合伙) 44558 | 代理人: | 赖耀华 |
地址: | 518042 广东省深圳市福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 疾病 名称 编码 方法 装置 设备 存储 介质 | ||
1.一种疾病名称的编码方法,其特征在于,所述方法包括:
获取待编码的疾病名称,确定与所述待编码的疾病名称对应的第一向量短语矩阵;
将所述第一向量短语矩阵输入到预设的医学实体识别模型,确定与所述待编码的疾病名称对应的至少一个疾病标签,对所述至少一个疾病标签进行逻辑重构,获取重构疾病名称,其中,所述疾病标签包括部位、症状、病因中的一个或多个;
确定与所述重构疾病名称对应的第二向量短语矩阵,将所述第二向量短语矩阵输入到预设的疾病诊断类目编码预测模型中,获取多个待定类目编码;
根据所述多个待定类目编码,确定多个候选疾病名称;
计算待编码的疾病名称与每一个候选疾病名称之间的相似度,根据相似度在多个候选疾病名称中确定目标疾病名称,将所述目标疾病名称对应的细目编码作为目标编码。
2.根据权利要求1所述的疾病名称的编码方法,其特征在于,所述确定与所述待编码的疾病名称对应的第一向量短语矩阵的步骤,还包括:
对所述待编码的疾病名称进行拆解,获取拆解之后多个汉字;
根据预设的汉字向量库确定每一个汉字的向量,并基于待编码的疾病名称组成第一向量短语矩阵。
3.根据权利要求1所述的疾病名称的编码方法,其特征在于,所述方法还包括:
获取包含疾病名称的医疗数据,对每一条医疗数据中的疾病标签进行标注;
对进行标注之后的医疗数据进行汉字切分处理,获取多个汉字,根据预设的汉字向量库确定每一个汉字的向量,并构建医疗数据对应的第三向量短语矩阵;
基于Bi-LSTM训练模型对标注有疾病标签的医疗数据进行分类训练,以构建所述预设的医学实体识别模型。
4.根据权利要求1所述的疾病名称的编码方法,其特征在于,所述对所述至少一个疾病标签进行逻辑重构,获取重构疾病名称的步骤,还包括:
根据预设的标签排序,对所述至少一个疾病标签进行逻辑重构,获取重构疾病名称;
所述确定与所述重构疾病名称对应的第二向量短语矩阵的步骤,还包括:
对所述重构疾病名称进行拆解,获取拆解之后的多个汉字;
根据预设的汉字向量库确定每一个汉字的向量,并基于所述重构疾病名称组成第二向量短语矩阵。
5.根据权利要求1所述的疾病名称的编码方法,其特征在于,所述将所述第二向量短语矩阵输入到预设的疾病诊断类目编码预测模型中,获取多个待定类目编码的步骤,还包括:
所述预设的疾病诊断类目编码预测模型包括多个根据不同参数训练得到的Bi-LSTM模型,且Bi-LSTM模型包括LSTM层、全连接层、输出层;
根据多个Bi-LSTM模型对类目编码进行预测,以得到多个类目编码以及对应的概率值;
根据概率值确定N个待定类目编码,所述N个待定类目编码的概率值大于其他类目编码的概率值,其中,所述N等于3。
6.根据权利要求5所述的疾病名称的编码方法,其特征在于,所述根据所述多个待定类目编码,确定多个候选疾病名称的步骤,还包括:
在预设的疾病编码数据库中,确定与所述多个待定类目编码对应的多个候选疾病名称;其中,所述候选疾病名称的编码对应于所述多个待定类目编码的上级类目编码或下级的细目编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市方迪融信科技有限公司,未经深圳市方迪融信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210151142.2/1.html,转载请声明来源钻瓜专利网。