[发明专利]医疗时序数据缺失值处理方法在审

专利信息
申请号: 202110955923.2 申请日: 2021-08-19
公开(公告)号: CN113672607A 公开(公告)日: 2021-11-19
发明(设计)人: 史振坤;郝雨微;张一嘉;左祥麟;左万利 申请(专利权)人: 吉林大学
主分类号: G06F16/215 分类号: G06F16/215;G06F16/2458;G06N3/04;G06N3/08
代理公司: 沈阳一诺君科知识产权代理事务所(普通合伙) 21266 代理人: 王建男
地址: 130000 吉*** 国省代码: 吉林;22
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 医疗 时序 数据 缺失 处理 方法
【说明书】:

发明属于医疗数据处理技术领域,尤其医疗时序数据缺失值处理方法,包括以下步骤:通过各种临床数据模式来填补缺失值,包括以下步骤:数据输入,在输入层输入含有缺失值的多变量原始时序数据、插值开关矩阵和输入数据时间戳矩阵,同时添加补充输入;本发明本发明插值不需要任何前提假设,本发明可以极大的提高插值的准确性,通过处理数据得到高准确性的插值数据来进行死亡率预测,预测性能更好,本发明对不规则时序数据、含噪声较大的数据、突发性较强的数据均有很好的插值性能,适用于ICU临床多变量时序数据的缺失问题。

技术领域

本发明涉及医疗数据处理技术领域,尤其涉及医疗时序数据缺失值处理方法。

背景技术

在医疗数据挖掘过程中,多变量医疗时序数据是很常见的一类数据。由于各种原因,这些数据中包含大量的缺失值。缺失值的存在,在很大程度上降低了下游应用的性能,医疗时序数据中的缺失值是指在当前观测中未收集到任何数据从而导致该时刻数据集中的值为空。从前期研究结果表明,缺失值的存在会严重影响从这些数据中得出结论的可靠性。在临床中,导致数据缺失的原因主要有四个:设备故障、临床医护人员忘记记录、某些数据不需要收集(例如,医护人员认为某些数据对该病人意义不大,故放弃收集)、某些数据只在特定状态下进行收集(例如,体温数据在病人发烧时一直在收集,但是当病人体温恢复正常后停止收集)。

对医疗数据缺失值进行处理的方法有多种,最直接也是最简单的方法就是将这些缺失数据忽略。但是忽略数据会改变原始的数据结构,从而破坏原有数据的整体性。为了保持数据的结构完整,一种常规处理方法是使用样本的均值来带代替那些缺失值。然而,用均值填充方法适合样本比较平滑的数据,该方法在不同应用领域的填补质量差别很大。这种方法对ICU数据并不适用,因为ICU数据往往具有较强的突发性。另一类方法就是对缺失值进行插补,例如k临近(KNN)、矩阵分解或通过链式方程进行多源插补。但是大多数的插补方法均需要较强的前提假设,如假设数值是随机缺失的。这就导致当假设不满足时,插补方法无法正确高效的工作,故这些插补方法的通用性不佳。在前面的疾病诊断与死亡率预测的工作中,尝试采用这方法对缺失值进行处理,但处理的效果并不理想。

为解决上述问题,本申请中提出医疗时序数据缺失值处理方法。

发明内容

(一)发明目的

为解决背景技术中存在的技术问题,本发明提出医疗时序数据缺失值处理方法。

(二)技术方案

为解决上述问题,本发明提供了医疗时序数据缺失值处理方法,包括以下步骤:

S1、通过各种临床数据模式来填补缺失值,包括以下步骤:

S11、数据输入,在输入层输入含有缺失值的多变量原始时序数据Xp、插值开关矩阵SW和输入数据时间戳矩阵Sp,同时添加了Mp、Δp、BP、CMRP作为补充输入,

S12、插补值初始化,不同医疗操作采用不同的插补策略,相同的医疗操作不同的特征应该有不同的插补策略,对于同一个特征其插值策略应该随时间变化而变化;

S13、高精度插补,包括循环层、回归层和评估层,通过RNN实现循环层,通过一层全连接网络实现回归层,通过预先定义的规则实现评估层;

S14、插补值约束,通过二项分布、正态分布和泊松分布进行约束,并通过最大值、最小值来进一步约束,得出插补结果;

S2、将填补后的数据用于死亡率预测,具体损失函数定义如下:

其中,其中Nk是类别k中训练集中样本数量,N是训练集的样本大小,和分别是类k的真实值和预测值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110955923.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top