[发明专利]一种电子病历数据处理方法及系统在审
申请号: | 202110281535.0 | 申请日: | 2021-03-16 |
公开(公告)号: | CN112863628A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 陈峰;刘升平;梁家恩 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G06F16/35;G06N3/08;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电子 病历 数据处理 方法 系统 | ||
本发明涉及一种电子病历数据处理方法及系统,该方法包括:按照预设的映射规则将病历文书中的名称进行映射;对无法按照预设的所述映射规则进行映射的病历文书,通过预先训练的深度学习模型进行分类。本发明通过规则结合模型方式可以减少人工查看每种类型文书的工作量,尤其是综合医院文书类型比较多或者专科医院文书名字比较特殊情况下节省工作量的效果更为明显。
技术领域
本发明涉及深度学习领域,具体涉及一种电子病历数据处理方法及系统。
背景技术
电子病历为非结构化病历,而且不同医院的病历内容结构和文书名字的差异,需要对病历文书做标准化映射。一般通用的做法是根据文书的名字结合病历内容中标题或者关键字进行映射。
由于不同医院的病历在内容结构上和名字命名上存在差异,单从文件名字或者关键字去映射,可能对病历划分比较细的专科医院或者一些长尾的病历不能映射完全,而且在对新医院文书映射时,需要查看所有不同类型文书名字和内容存在较大工作量。
发明内容
本发明提供一种电子病历数据处理方法及系统,能够解决查看所有不同类型文书名字和内容存在较大工作量的技术问题。
本发明解决上述技术问题的技术方案如下:
一种电子病历数据处理方法,包括:
按照预设的映射规则将病历文书中的名称进行映射;
对无法按照预设的所述映射规则进行映射的病历文书,通过预先训练的深度学习模型进行分类。
本发明的有益效果是:
通过规则结合模型方式可以减少人工查看每种类型文书的工作量,尤其是综合医院文书类型比较多或者专科医院文书名字比较特殊情况下节省工作量的效果更为明显。
进一步,所述通过深度学习模型进行分类,具体包括:
对病历文书进行编码,将编码的结果通过深度学习模型映射到预先定义的类别空间,得到所述病历文书的类别。
上述进一步方案的有益效果是:对无法通过规则映射方式处理的病历文书,进行编码后通过深度学习模型进行类别的确定。
进一步,所述类别空间包括N个文书类别和一个其他类,所述通过深度学习模型进行分类,具体还包括:
对分类到所述其他类的病历文书进行拒识。
上述进一步方案的有益效果是:通过设置的其他类来确定无法通过深度学习模型来确定类型的病历文书。
进一步,还包括:当所述深度学习模型的训练数据中增加新的电子病历数据时,对所述深度学习模型进行增量训练。
上述进一步方案的有益效果是:对新增的电子病历数据进行增量训练方式,可以丰富模型训练数据。
进一步,对所述深度学习模型进行增量训练,具体包括:
按照加入新的电子病历数据后的训练数据中病历文书的名称的类型进行归类统计;分别将相同类型的病历文书以批量形式送入所述深度学习模型进行预测,得到该批量数据中各个病历文书的预测类及对应的概率;如果预测得到的最大概率大于或等于预设阈值,则将预测类与所述最大概率对应的预测类不同的病历文书的类型修改为所述最大概率对应的预测类后加入到所述训练数据中;如果预测得到的最大概率小于所述预设阈值,则从该批量数据中随机抽取一部分人工进行标注后加入到训练数据中,继续训练模型,直至预测得到的最大概率大于或等于所述预设阈值。
上述进一步方案的有益效果是:对新医院的病历采用基于模型预测的结果进行统计,根据统计结果对部分病历文书标注,进行增量训练,适应新医院文书类型同时减少人工工作量。
一种电子病历数据处理系统,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110281535.0/2.html,转载请声明来源钻瓜专利网。