[发明专利]基于决策树模型与逻辑回归模型组合的感染筛查方法在审
申请号: | 202111019378.2 | 申请日: | 2021-09-01 |
公开(公告)号: | CN113470837A | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 商春恒;王云峰 | 申请(专利权)人: | 广东省大湾区集成电路与系统应用研究院;中国科学院微电子研究所 |
主分类号: | G16H50/80 | 分类号: | G16H50/80;G16H50/20;G06K9/62;G06N20/20;G06F17/18 |
代理公司: | 无锡市汇诚永信专利代理事务所(普通合伙) 32260 | 代理人: | 曹慧萍 |
地址: | 510535 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 决策树 模型 逻辑 回归 组合 感染 方法 | ||
本发明公开了一种基于决策树模型与逻辑回归模型组合的感染筛查方法,其检测操作方便,可提高感染筛查准确性,该方法基于生命体征监护仪实现,生命体征监护仪与远程数据服务平台通信连接,远程数据服务平台依据临床数据进行感染筛查,该方法包括:通过生命体征监护仪检测获取用户临床数据,将临床数据随机划分为训练集、测试集,将训练集均分为两份:训练集A、训练集B,基于训练集A构建决策树模型,同时,对训练集A进行特征选择,将关键特征向量作为已构建的决策树模型的输入,获取新构造特征向量,基于组合特征向量,构造逻辑回归模型,基于决策树模型和逻辑回归模型组合,对测试集进行预测分类,获取分类结果。
技术领域
本发明涉及数据分析技术领域,具体为一种基于决策树模型与逻辑回归模型组合的感染筛查方法。
背景技术
目前,医院对感染性疾病的筛查主要通过CT(computed tomography)、临床特征、体温检测作为诊断方法,但CT(computed tomography)、临床特征、体温检测等受医疗技术及地域限制,仍存在检测结果获取滞后性、检测准确性差、感染风险高等问题。
例如,在新冠病毒大规模疫情的当前环境下,控制该病蔓延的有效途径是大规模筛查、患者隔离治疗及症状监测,目前检测大多基于RT-PCR(reverse transcriptionpolymerase chain reaction)实现,但在COVID-19爆发高峰期,RT-PCR 试剂盒严重短缺,医院一直在使用 computed tomography (CT) 、临床特征、体温检测作为替代诊断方法,CT、临床特征、体温检测等需要专业的医护人员操作,操作步骤繁琐,临床特征受医护人员检测经验、主观能动性影响,存在检测准确性差的问题。
发明内容
针对现有技术中存在的通过CT、临床特征、体温检测作为诊断方法,存在检测结果获取滞后性、检测准确性差的问题,本发明提供了一种基于决策树模型与逻辑回归模型组合的感染筛查方法,其检测操作方便,可提高感染筛查的准确性。
为实现上述目的,本发明采用如下技术方案:
一种基于决策树模型与逻辑回归模型组合的感染筛查方法,该方法基于生命体征监护仪实现,所述生命体征监护仪用于检测用户的临床数据,所述生命体征监护仪通过通信模块与远程数据服务平台通信连接,所述远程数据服务平台依据所述临床数据进行感染筛查,其特征在于,所述感染筛查方法包括: S1、通过所述生命体征监护仪,检测获取用户的临床数据;
S2、将所述临床数据随机划分为训练集、测试集,将所述训练集均分为两份:训练集A、训练集B;
S3、基于所述训练集A,对XGBoost模型进行训练,构建XGBoost模型,同时,对所述训练集A进行特征选择,选取关键特征;
S4、选取所述训练集B中的相应关键特征的关键特征向量,将所述关键特征向量作为已构建的所述XGBoost模型的输入,通过将所述XGBoost模型叶子节点的输出做OneHot编码,获取新构造特征向量;
S5、将所述新构造特征向量、关键特征向量合并,获取组合特征向量;
S6、基于所述组合特征向量,对Logistic回归模型进行训练,构造Logistic回归模型;
S7、基于所述XGBoost模型和Logistic回归模型组合,对所述测试集进行预测分类,获取分类结果。
其进一步特征在于,
步骤S1中,所述用户包括健康人、患者,所述临床数据为与病情相关的特征向量,所述临床数据包括:呼吸率平均数、呼吸率中位数、呼吸率最大值、呼吸率最小值、心率平均数、心率中位数、心率最大值、心率最小值、清醒百分比、REM期睡眠百分比、浅睡期百分比、深睡期百分比、睡眠潜伏期、睡眠时长、睡眠效率、睡眠得分、体动密度、体动分钟占比、清醒次数、翻身次数、睡眠期间呼吸暂停次数、呼吸暂停低通气指数、REM期呼吸暂停次数、浅睡期呼吸暂停次数、深睡期呼吸暂停次数;
步骤S2中,随机抽取所述临床数据中的75%作为所述训练集,剩余25%作为测试集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东省大湾区集成电路与系统应用研究院;中国科学院微电子研究所,未经广东省大湾区集成电路与系统应用研究院;中国科学院微电子研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111019378.2/2.html,转载请声明来源钻瓜专利网。