[发明专利]重症脊髓损伤预后的预测模型的建立方法有效
申请号: | 202110384018.6 | 申请日: | 2021-04-09 |
公开(公告)号: | CN112992346B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 范国鑫;刘华清;戎利民;庞卯;刘斌;张良明;黄桂芳;韩蓝青 | 申请(专利权)人: | 中山大学附属第三医院(中山大学肝脏病医院);清华珠三角研究院 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70 |
代理公司: | 广州汇盈知识产权代理事务所(普通合伙) 44603 | 代理人: | 童卫忠 |
地址: | 510630 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 重症 脊髓 损伤 预后 预测 模型 建立 方法 | ||
1.一种重症脊髓损伤预后的预测模型的建立方法,其特征在于包括下列步骤:提取诊断为脊髓损伤患者病例的临床数据,
1)纳入以下临床特征:人口统计信息包括种族、性别、年龄、体重指数、入院类型、ICU类型、入院来源、ICU时长、出ICU后住院时长;生命体征包括呼吸频率、心率、收缩压和舒张压、平均动脉压;实验室数据包括白细胞计数、红细胞计数RBC、血小板计数、嗜碱性粒细胞、嗜酸性粒细胞、嗜中性粒细胞、淋巴细胞、单核细胞、红细胞分布宽度RDW、血红蛋白、血细胞比容、平均红细胞血红蛋白量MCH、红细胞平均血红蛋白浓度MCHC、红细胞平均体积MCV、凝血酶原时间PT、活化部分凝血活酶时间APTT、国际标准化比值INR、氧浓度分数FiO2、氧分压PaO2、二氧化碳分压PaCO2、氢离子浓度指数PH、碳酸氢盐、乳酸盐、剩余碱BE、阴离子间隙、钾、钠、钙、镁、氯、磷酸盐、血尿素氮BUN、肌酐、白蛋白、血糖;药物的使用和治疗情况包括机械通气、硫酸吗啡、头孢唑林、氯化钾KCl、糖皮质激素、多巴胺、多巴酚丁胺、肾上腺素和去甲肾上腺素;
2)预处理临床特征:根据临床特征的类型,通过不同的填补方法处理缺失的数据,连续变量特征运用预测均值匹配方法填补,二元变量特征运用逻辑回归方法填补,多分类变量特征运用多项式回归方法填补,在步骤1)中缺失病例占总病例比重大于等于50%的临床特征,直接删除该临床特征,包括红细胞分布宽度RDW、氧分压PaO2,缺失病例数占总病例数比重大于0且小于50%的特征有种族、红细胞平均体积MCV、乳酸盐、硫酸吗啡,所述年龄、体重指数、白细胞计数、红细胞计数RBC、血小板计数、嗜碱性粒细胞、嗜酸性粒细胞、嗜中性粒细胞、淋巴细胞、单核细胞、红细胞分布宽度RDW、血红蛋白、血细胞比容、平均红细胞血红蛋白量MCH、红细胞平均血红蛋白浓度MCHC、红细胞平均体积MCV、凝血酶原时间PT、活化部分凝血活酶时间APTT、国际标准化比值INR、氧分压PaO2、二氧化碳分压PaCO2、氢离子浓度指数PH、碳酸氢盐、乳酸盐、剩余碱BE、阴离子间隙、钾、钠、钙、镁、氯、磷酸盐、血尿素氮BUN、肌酐、白蛋白、血糖、呼吸频率、心率、收缩压、舒张压、平均动脉压ICU时长、出ICU后住院时长、氧浓度分数FiO2是连续变量特征,所述机械通气、硫酸吗啡、头孢唑林、氯化钾KCl、糖皮质激素、多巴胺、多巴酚丁胺、肾上腺素和去甲肾上腺素是二元变量特征,其中所述种族、性别、ICU类型、入院来源转化为虚拟变量的形式;最终获得不同的特征,并按照合理的比例,随机划分为训练数据集、验证数据集和测试数据集;
3)纳入特征选择方法*机器学习分类算法的数量个算法组合:所述特征选择方法用于筛选具有显著预测价值的临床特征,将选定的临床特征用于训练机器学习分类算法,所述特征选择方法包括最大互信息系数MIC、嵌入随机森林RF、递归特征消除REF、嵌入线性支持向量分类器即嵌入LSVC、嵌入逻辑回归器即嵌入LR、嵌入树和最小冗余-最大相关度mRMR,所述机器学习分类算法包括逻辑回归、线性判别分析LDA、支持向量机SVM、K最近邻KNN、高斯朴素贝叶斯NB、决策树、额外决策树、随机森林、装袋算法Bagging、自适应增强AdaBoost、梯度提升决策树GBDT、极端梯度提升XGBoosting、轻型梯度提升机lightGBM、多层感知器MLP和深度神经网络DNN;
4)从步骤3)中的算法组合在验证数据集的预测表现,对micro平均曲线下面积AUC进行排序组合,选出micro平均曲线下面积AUC最佳的算法组合,利用堆叠法集成所述算法组合,得到预测模型,所述预测表现是指AUC的高低,AUC的高低是指AUC数值由大到小的排列,具体而言指micro平均曲线下面积AUC的大小,越大说明预测表现越好,越小说明预测表现越差,其中所述验证数据集是训练数据集通过用特征选择算法选择且交叉验证后而得到;
步骤3)中建立AUC矩阵,即所述训练数据集通过用特征选择算法选择且交叉验证后得到验证数据集的AUC矩阵,AUC矩阵的纵坐标是特征选择方法,横坐标是机器学习分类算法,然后构成特征选择方法*机器学习分类算法的数量个算法组合模型;根据特征选择方法*机器学习分类算法的数量个算法组合模型在验证数据集的预测表现,选出micro平均曲线下面积AUC最大的三个算法组合,利用所述堆叠法集成这三个算法组合,得到所述最终的预测模型;根据7个特征选择算法*15个机器学习分类算法组合在验证数据集的预测表现,所述选出micro平均曲线下面积(AUC)最佳三个组合分别为:
最佳算法组合1:嵌入树*梯度提升决策树GBDT;
最佳算法组合2:嵌入树*极端梯度提升XGBoosting;
最佳算法组合3:嵌入LSVC*极端梯度提升XGBoosting;
其中:
嵌入树筛选出来的特征包括:格拉斯总分、住院时长、机械通气、收缩压、舒张压、ICU时长、出ICU后住院时长、白蛋白、呼吸频率、头孢唑林、乳酸、碳酸氢盐、红细胞分布宽度RDW、动脉平均压、血红蛋白、年龄、HR心率、氯化钾、血尿素氮、诊断总数、吗啡、血氯离子、血糖、RBC白细胞、钠离子、氧浓度分数FiO2;
嵌入LSVC筛选出来的特征包含:肾上腺素、去甲肾上腺素、氧浓度分数FiO2、收缩压、头孢唑林、糖皮质激素、碳酸氢盐、格拉斯总分、住院时长、机械通气、血红蛋白、年龄、HR心率、白蛋白、氯化钾、血尿素氮、诊断总数、血氯离子、乳酸、凝血激活酶时间、动脉平均压、WBC白细胞、红细胞、血小板、血糖;
选出患者出院终点的micro平均曲线下面积AUC的最佳三个算法组合进行构建最终预测模型,所述最佳三个算法组合是嵌入树*梯度提升决策树GBDT、嵌入树*极端梯度提升XGBoosting、嵌入LSVC*极端梯度提升XGBoosting;患者出院终点为最终预测模型的预测目标,即构建的最终预测模型为出院终点模型,用于一次性预测死亡、回家休养、继续专业康复护理治疗三个类别的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学附属第三医院(中山大学肝脏病医院);清华珠三角研究院,未经中山大学附属第三医院(中山大学肝脏病医院);清华珠三角研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110384018.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种风扇磨煤机制粉系统抽炉烟防爆的改造系统
- 下一篇:调用接口的方法及系统