[发明专利]基于stacking算法的妊娠糖尿病预测方法在审
| 申请号: | 202010947618.4 | 申请日: | 2020-09-10 |
| 公开(公告)号: | CN112185555A | 公开(公告)日: | 2021-01-05 |
| 发明(设计)人: | 高玛娜 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H50/70 |
| 代理公司: | 济南佰智蔚然知识产权代理事务所(普通合伙) 37285 | 代理人: | 王砚雷 |
| 地址: | 100020 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 stacking 算法 妊娠 糖尿病 预测 方法 | ||
本发明公开了基于stacking算法的妊娠糖尿病预测方法,涉及妊娠糖尿病预测技术领域,具体为基于stacking算法的妊娠糖尿病预测方法,包括以下步骤:S1、患病数据收集;S2、数据处理;S3、特征分析与特征构造;S4、构造最优子集;S5、单集成预测模型构建;S6、模型融合;S7、融合模型与单模型预测性能分析与对比。该基于stacking算法的妊娠糖尿病预测方法基于集成学习建立一个有效的妊娠糖尿病预测糖尿病患病风险的模型,帮助医护人员预测处于妊娠糖尿病的患者,及时并准确的对高危人群采取针对性的措施,这将有助于妊娠期糖尿病的辅助诊断和预防,为智能诊断和减少不良妊娠作出贡献。
技术领域
本发明涉及妊娠糖尿病预测技术领域,具体为基于stacking算法的妊娠糖尿病预测方法。
背景技术
妊娠期糖尿病是导致二型糖尿病及其综合症蔓延全球的重要原因之一,根据研究表明,截止2019年我国患有妊娠期糖尿病的人数排名世界第二。妊娠期糖尿病(GDM)指的是孕妇在妊娠期表现的糖代谢异常,此类型的糖尿病是由于妊娠导致的暂时性病症,会影响到孕妇和胎儿的人身安全。妊娠期糖尿病患者容易患有高血压,原因是人体内的胰岛素分泌不足,血糖含量过高,从而影响到血管的弹性。除此之外,高浓度的血糖会促进孕妇分泌的羊水增加,并刺激到子宫内膜,容易使胎儿早产和窒息。高血糖还会影响到免疫系统,影响白细胞的吞噬能力,导致免疫能力下降,进而发生胎盘早剥的情况,目前的研究发现妊娠期糖尿病是导致孕妇不正常妊娠的原因之一,包括胎儿巨大症、胎儿肩难产。妊娠期糖尿病的影响不止于此,GDM会对母体和胎儿带来长期影响,有研究结果说明,患有GDM的孕妇在产后五年内,有13%-63%的概率患有二型糖尿病且糖耐量异常。
近年来,机器学习算法在医疗领域的应用频率和研究深度增长迅速,已经有学者应用机器学习算法实现对部分疾病患病率的预测,且效果显著,集成学习是机器学习算法中较有特点的一类,它是按照将弱分类器集成为强分类器的思路来组合基础模型,集成学习模型除了在稳定性和泛化能力上相比传统模型表现突出,在最终的预测准确率上也相对较高。
疾病预测在根据真实数据建模的过程中,往往会遇到数据质量差、缺失值较多、正负样本有偏等问题,在数据预处理过程中,选择怎样的处理方式将使预测精度最高的问题;使用stacking集成学习框架并加以改进,以解决样本标签不足可能会产生的过拟合问题,并使融合后的模型较单模型性能表现更好的缺点。
发明内容
针对现有技术的不足,本发明提供了基于stacking算法的妊娠糖尿病预测方法,解决了上述背景技术中提出疾病预测在根据真实数据建模的过程中,往往会遇到数据质量差、缺失值较多、正负样本有偏等问题,在数据预处理过程中,选择怎样的处理方式将使预测精度最高的问题;使用stacking集成学习框架并加以改进,以解决样本标签不足可能会产生的过拟合问题,并使融合后的模型较单模型性能表现更好的问题。
为实现以上目的,本发明通过以下技术方案予以实现:基于stacking算法的妊娠糖尿病预测方法,包括以下步骤:
S1、患病数据收集;
S2、数据处理;
S3、特征分析与特征构造;
S4、构造最优子集;
S5、单集成预测模型构建;
S6、模型融合;
S7、融合模型与单模型预测性能分析与对比。
可选的,所述步骤S1、患病数据收集中,收集便携式计算机,通过便携式计算机登录阿里云医疗数据库,收集阿里云医疗真实数据,记录患病数据备份。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010947618.4/2.html,转载请声明来源钻瓜专利网。





