[发明专利]医疗时序数据缺失值处理方法在审
申请号: | 202110955923.2 | 申请日: | 2021-08-19 |
公开(公告)号: | CN113672607A | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 史振坤;郝雨微;张一嘉;左祥麟;左万利 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2458;G06N3/04;G06N3/08 |
代理公司: | 沈阳一诺君科知识产权代理事务所(普通合伙) 21266 | 代理人: | 王建男 |
地址: | 130000 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 时序 数据 缺失 处理 方法 | ||
1.医疗时序数据缺失值处理方法,其特征在于,包括以下步骤:
S1、通过各种临床数据模式来填补缺失值,包括以下步骤:
S11、数据输入,在输入层输入含有缺失值的多变量原始时序数据Xp、插值开关矩阵SW和输入数据时间戳矩阵Sp,同时添加了Mp、Δp、BP、CMRP作为补充输入,
S12、插补值初始化,不同医疗操作采用不同的插补策略,相同的医疗操作不同的特征应该有不同的插补策略,对于同一个特征其插值策略应该随时间变化而变化;
S13、高精度插补,包括循环层、回归层和评估层,通过RNN实现循环层,通过一层全连接网络实现回归层,通过预先定义的规则实现评估层;
S14、插补值约束,通过二项分布、正态分布和泊松分布进行约束,并通过最大值、最小值来进一步约束,得出插补结果;
S2、将填补后的数据用于死亡率预测,具体损失函数定义如下:
其中,其中Nk是类别k中训练集中样本数量,N是训练集的样本大小,和分别是类k的真实值和预测值。
2.根据权利要求1所述的医疗时序数据缺失值处理方法,其特征在于,所述补充输入的算法为:
3.根据权利要求1所述的医疗时序数据缺失值处理方法,其特征在于,所述S14中,约束算法为:
4.根据权利要求1所述的医疗时序数据缺失值处理方法,其特征在于,所述S12中,插补值初始化方法定义如下:
5.根据权利要求4所述的医疗时序数据缺失值处理方法,其特征在于,插补值初始化后进入插补网络,通过迭代的方法在序列中根据窗口j的邻居信息和历史信息对缺失值进行插补,其损失函数表示为RNN机制将更新为
其中是通过循环神经网络插补出来的值。
6.根据权利要求1所述的医疗时序数据缺失值处理方法,其特征在于,所述S13中,RNN部分使用双向插补策略和不同插补模式的RGRU-D来实现,添加了3个补充模式到GRU-D的隐藏状态,形成了RGRU-D,这三个补充模式分别为遮罩矩阵M、突发性参数矩阵B以及累计缺失率矩阵CMR,引入补充数据源,被定义为:
其中可以根据以下公式计算得出:
7.根据权利要求6所述的医疗时序数据缺失值处理方法,其特征在于,所述评估层应用了两种类型的评估来分别对应这两个类型的相关性,两种类型包括:
1)特征相关性评估FR,在第j个时间窗口内da,db,a≠b之间的评估;
2)历史相关的评估HR,考虑到特征本身的时间相关性,HR具体可以表达为对于第j个和第k个时间窗口(j≠k),X:,j于X:,k之间的相关性。
8.根据权利要求7所述的医疗时序数据缺失值处理方法,其特征在于,通过FR估计qj,qj表示为:
其中Wq与bq是学习参数,该参数可以通过与回归层一起训练获得,将Wq的对角线元素限制为0,qj中的第i个值就是Xi,j基于其他值的约束特征。
9.根据权利要求8所述的医疗时序数据缺失值处理方法,其特征在于,所述HR将学习一个对应的双向的序列级别的估计X+和X-,在正向传播方向,并伴随有一系列的损失评估序列在反向传播方向,产生一个评估序列和另一个损失评估序列通过计算正向和反向的距离,使每个步骤中的预测保持连贯性,即
10.根据权利要求9所述的医疗时序数据缺失值处理方法,其特征在于,HR最终的loos项是由l+,l-,ldi三项累加而得出的,RGRU-D的优化目标是使得时间窗口的loss值最小其中lj的计算方法如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110955923.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车限位臂的快速样件制作方法
- 下一篇:物镜调焦机构
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置