[发明专利]基于电子病历数据生成健康教育数据的方法和系统在审
申请号: | 202210048004.1 | 申请日: | 2022-01-17 |
公开(公告)号: | CN114420232A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 鲜湛;贺昕;曾柏霖;张海滨 | 申请(专利权)人: | 深圳万海思数字医疗有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G16H50/70 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 葛钟 |
地址: | 100043 北京市石景山*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 电子 病历 数据 生成 健康 教育 方法 系统 | ||
1.一种基于电子病历数据生成健康教育数据的方法,其特征在于,包括:
获取第一患者数据;所述第一患者数据包括患者症状数据;
将所述第一患者数据输入预设疾病诊断模型,得到所述第一患者数据对应的疾病类型;
根据所述第一患者数据对应的疾病类型在预设健康宣教知识库中确定出目标疾病类型;
根据所述目标疾病类型,以及预设疾病类型与健康教育数据之间的对应关系,在所述预设健康宣教知识库中确定出目标健康教育数据;
将所述目标健康教育数据发送给预设终端设备,以使用户根据所述预设终端设备显示的信息获知所述目标健康教育数据的内容。
2.根据权利要求1所述的基于电子病历数据生成健康教育数据的方法,其特征在于,所述预设疾病诊断模型的训练过程如下:
通过电子病历数据库获取第一样本数据;所述第一样本数据由多组第二患者数据组成,每组所述第二患者数据包括患者症状数据和疾病类型;
将所述第一样本数据划分为训练数据集和测试数据集;
采用所述训练数据集训练多个预设预训练语言模型;
采用所述测试数据集测试训练后的各所述预设预训练语言模型,得到测试结果;
根据所述测试结果在训练后的各所述预设预训练语言模型中确定出目标预设预训练语言模型,并将所述目标预设预训练语言模型定义为所述预设疾病诊断模型。
3.根据权利要求2所述的基于电子病历数据生成健康教育数据的方法,其特征在于,采用所述训练数据集训练预设预训练语言模型的方法如下:
步骤一、清洗所述训练数据集,以抽取所述训练数据集中的患者症状描述文本,以及删除所述训练数据集中的缺失数据和重复数据;
步骤二、加载所述预设预训练语言模型;
步骤三、设置所述预设预训练语言模型的训练超参数;所述训练超参数包括epochs;
步骤四、判断当前epoch计数是否小于预设训练次数,得到第一预设结果;当所述第一预设结果为是时,执行步骤五;当所述第一预设结果为否时,执行步骤十二;
步骤五、判断所述训练数据集中是否包含有未加载的第一样本数据,得到第二预设结果;当所述第二预设结果为是时,执行步骤六;当所述第二预设结果为否时,执行步骤十一;
步骤六、在所述训练数据集的未加载的第一样本数据中确定目标第一样本数据,并将所述目标第一样本数据输入所述预设预训练语言模型;
步骤七、通过所述预设预训练语言模型得到所述目标第一样本数据在各个疾病预测类别上的概率分布数据;
步骤八、根据所述概率分布数据确定出概率最大的疾病预测类别,并将所述概率最大的疾病预测类别作为目标疾病类别;
步骤九、根据所述目标疾病类别与所述目标第一样本数据对应的实际疾病类别确定所述预设预训练语言模型的损失数据,并根据所述损失数据调整所述预设预训练语言模型的训练参数;
步骤十、根据所述所述损失数据更新所述训练超参数,并执行步骤五;
步骤十一、增加epoch计数,并执行步骤四;
步骤十二、保存训练后的所述预设预训练语言模型。
4.根据权利要求3所述的基于电子病历数据生成健康教育数据的方法,其特征在于,所述通过所述预设预训练语言模型得到所述目标第一样本数据在各个疾病预测类别上的概率分布数据,包括:
将所述目标第一样本数据输入所述预设预训练语言模型的输入层,得到所述目标第一样本数据的向量表示;
将所述目标第一样本数据的向量表示输入所述预设预训练语言模型的transformerencoder,得到所述目标第一样本数据的语义表示;
将所述目标第一样本数据的语义表示输入所述预设预训练语言模型的输入softmax分类层,得到所述目标第一样本数据在各个疾病预测类别上的概率分布数据。
5.根据权利要求2所述的基于电子病历数据生成健康教育数据的方法,其特征在于,所述测试结果包括预测结果准确率;
所述根据所述测试结果在训练后的各所述预设预训练语言模型中确定出目标预设预训练语言模型,包括:
在训练后的各所述预设预训练语言模型中确定出预测结果准确率最高的预设预训练语言模型,并将所述预测结果准确率最高的预设预训练语言模型定义为所述目标预设预训练语言模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳万海思数字医疗有限公司,未经深圳万海思数字医疗有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210048004.1/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置