[发明专利]医疗时序数据缺失值处理方法在审
申请号: | 202110955923.2 | 申请日: | 2021-08-19 |
公开(公告)号: | CN113672607A | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 史振坤;郝雨微;张一嘉;左祥麟;左万利 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2458;G06N3/04;G06N3/08 |
代理公司: | 沈阳一诺君科知识产权代理事务所(普通合伙) 21266 | 代理人: | 王建男 |
地址: | 130000 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 时序 数据 缺失 处理 方法 | ||
本发明属于医疗数据处理技术领域,尤其医疗时序数据缺失值处理方法,包括以下步骤:通过各种临床数据模式来填补缺失值,包括以下步骤:数据输入,在输入层输入含有缺失值的多变量原始时序数据、插值开关矩阵和输入数据时间戳矩阵,同时添加补充输入;本发明本发明插值不需要任何前提假设,本发明可以极大的提高插值的准确性,通过处理数据得到高准确性的插值数据来进行死亡率预测,预测性能更好,本发明对不规则时序数据、含噪声较大的数据、突发性较强的数据均有很好的插值性能,适用于ICU临床多变量时序数据的缺失问题。
技术领域
本发明涉及医疗数据处理技术领域,尤其涉及医疗时序数据缺失值处理方法。
背景技术
在医疗数据挖掘过程中,多变量医疗时序数据是很常见的一类数据。由于各种原因,这些数据中包含大量的缺失值。缺失值的存在,在很大程度上降低了下游应用的性能,医疗时序数据中的缺失值是指在当前观测中未收集到任何数据从而导致该时刻数据集中的值为空。从前期研究结果表明,缺失值的存在会严重影响从这些数据中得出结论的可靠性。在临床中,导致数据缺失的原因主要有四个:设备故障、临床医护人员忘记记录、某些数据不需要收集(例如,医护人员认为某些数据对该病人意义不大,故放弃收集)、某些数据只在特定状态下进行收集(例如,体温数据在病人发烧时一直在收集,但是当病人体温恢复正常后停止收集)。
对医疗数据缺失值进行处理的方法有多种,最直接也是最简单的方法就是将这些缺失数据忽略。但是忽略数据会改变原始的数据结构,从而破坏原有数据的整体性。为了保持数据的结构完整,一种常规处理方法是使用样本的均值来带代替那些缺失值。然而,用均值填充方法适合样本比较平滑的数据,该方法在不同应用领域的填补质量差别很大。这种方法对ICU数据并不适用,因为ICU数据往往具有较强的突发性。另一类方法就是对缺失值进行插补,例如k临近(KNN)、矩阵分解或通过链式方程进行多源插补。但是大多数的插补方法均需要较强的前提假设,如假设数值是随机缺失的。这就导致当假设不满足时,插补方法无法正确高效的工作,故这些插补方法的通用性不佳。在前面的疾病诊断与死亡率预测的工作中,尝试采用这方法对缺失值进行处理,但处理的效果并不理想。
为解决上述问题,本申请中提出医疗时序数据缺失值处理方法。
发明内容
(一)发明目的
为解决背景技术中存在的技术问题,本发明提出医疗时序数据缺失值处理方法。
(二)技术方案
为解决上述问题,本发明提供了医疗时序数据缺失值处理方法,包括以下步骤:
S1、通过各种临床数据模式来填补缺失值,包括以下步骤:
S11、数据输入,在输入层输入含有缺失值的多变量原始时序数据Xp、插值开关矩阵SW和输入数据时间戳矩阵Sp,同时添加了Mp、Δp、BP、CMRP作为补充输入,
S12、插补值初始化,不同医疗操作采用不同的插补策略,相同的医疗操作不同的特征应该有不同的插补策略,对于同一个特征其插值策略应该随时间变化而变化;
S13、高精度插补,包括循环层、回归层和评估层,通过RNN实现循环层,通过一层全连接网络实现回归层,通过预先定义的规则实现评估层;
S14、插补值约束,通过二项分布、正态分布和泊松分布进行约束,并通过最大值、最小值来进一步约束,得出插补结果;
S2、将填补后的数据用于死亡率预测,具体损失函数定义如下:
其中,其中Nk是类别k中训练集中样本数量,N是训练集的样本大小,和分别是类k的真实值和预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110955923.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车限位臂的快速样件制作方法
- 下一篇:物镜调焦机构
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置