[发明专利]基于stacking算法的妊娠糖尿病预测方法在审

专利信息
申请号: 202010947618.4 申请日: 2020-09-10
公开(公告)号: CN112185555A 公开(公告)日: 2021-01-05
发明(设计)人: 高玛娜 申请(专利权)人: 北京工业大学
主分类号: G16H50/30 分类号: G16H50/30;G16H50/70
代理公司: 济南佰智蔚然知识产权代理事务所(普通合伙) 37285 代理人: 王砚雷
地址: 100020 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 stacking 算法 妊娠 糖尿病 预测 方法
【权利要求书】:

1.基于stacking算法的妊娠糖尿病预测方法,其特征在于,所述包括以下步骤:

S1、患病数据收集;

S2、数据处理;

S3、特征分析与特征构造;

S4、构造最优子集;

S5、单集成预测模型构建;

S6、模型融合;

S7、融合模型与单模型预测性能分析与对比。

2.根据权利要求1所述的基于stacking算法的妊娠糖尿病预测方法,其特征在于:所述步骤S1、患病数据收集中,收集便携式计算机,通过便携式计算机登录阿里云医疗数据库,收集阿里云医疗真实数据,记录患病数据备份。

3.根据权利要求1所述的基于stacking算法的妊娠糖尿病预测方法,其特征在于:所述步骤S2、数据处理中,选用合适的数据预处理方法处理缺失值,处理和选择特征来构成特征子集,使构成的特征子集能在算法上表现更好的效果,以及构造有效的特征子集,选出对妊娠糖尿病有影响的特征变量作为模型的输入变量,使计算的复杂度简化并提升模型的预测效果。

4.根据权利要求1所述的基于stacking算法的妊娠糖尿病预测方法,其特征在于:所述步骤S3、特征分析与特征构造中,分别对比步骤S2、数据处理中异常值处理和缺失值处理,对数据进行数据处理及分析。

5.根据权利要求1所述的基于stacking算法的妊娠糖尿病预测方法,其特征在于:所述步骤S4、构造最优子集中,选取S3、特征分析与特征构造中,最优数据构建子集。

6.根据权利要求1所述的基于stacking算法的妊娠糖尿病预测方法,其特征在于:所述步骤S5、单集成预测模型构建中,用集成学习算法构建预测模型来预测妊娠糖尿病,以及根据数据集特点对模型参数进行调优,分别建立XGBoost、随机森林、catboost、逻辑回归四个单集成妊娠糖尿病预测模型,并通过实验调参使单集成模型的预测效果达到最佳。

7.根据权利要求1所述的基于stacking算法的妊娠糖尿病预测方法,其特征在于:所述步骤S6、模型融合中,结合步骤S5、单集成预测模型构建中XGBoost、随机森林、catboost、逻辑回归四者的优点,弥补不足,选择两层stacking集成学习框架进行模型融合,选取XGBoost、随机森林与catboost这三种模型当做模型融合的基模型作为训练,并得出预测结果,将预测结果作为特征,应用到逻辑回归模型中进行训练,训练出最终预测模型。

8.根据权利要求1所述的基于stacking算法的妊娠糖尿病预测方法,其特征在于:所述步骤S7、融合模型与单模型预测性能分析与对比中,将步骤S6、模型融合中的预测结果与步骤S5、单集成预测模型构建中四种单集成预测模型预测结果进行汇总,对AUC值进行比较,验证融合模型的预测表现是否优于其他模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010947618.4/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top