[发明专利]一种融合Bagging的XGboost慢性肾病分期预测算法在审
申请号: | 201810383551.9 | 申请日: | 2018-04-26 |
公开(公告)号: | CN108573753A | 公开(公告)日: | 2018-09-25 |
发明(设计)人: | 葛晓雪;李盛乐;葛胜男 | 申请(专利权)人: | 葛晓雪 |
主分类号: | G16H50/70 | 分类号: | G16H50/70 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 弱分类器 训练集 慢性肾病 预测算法 集成学习算法 强分类器 算法基础 算法学习 原始样本 融合 引入 投票 算法 抽取 制定 | ||
本发明公开了一种融合Bagging的XGboost慢性肾病分期预测算法,该算法在XGboost算法基础上,引入Bagging集成学习算法,通过对原始样本进行k轮集中有放回的抽取训练集,得到k个相互独立的训练集,将每个训练集通过XGboost算法学习到的弱分类器通过一定的规则,组合成一个强分类器,在规则的制定上,引入“投票”机制,即“少数服从多数”原则,每个弱分类器都具有投票权且重要性相同,弱分类器器投出最多票数的类别或者类别之一为最终类别。
技术领域
本发明涉及慢性肾病分类预测算法,特别涉及一种融合Bagging的XGboost慢性肾病分期预测算法。
背景技术
由于慢性肾病早期症状不明显、病因复杂及患者自我意识薄弱,造成慢性肾病知晓率、早期诊断率和治疗率都较低,导致目前慢性肾病防治困难的现状。将数据挖掘技术应用于医疗领域,利用已知的医疗数据建立模型,为疾病诊断和预后提供一定的参考,是传统医学与信息技术相结合的典型应用。Bagging算法是一种将弱分类器组装成强分类器的方法,通过从原始样本进行k轮集中有放回的抽取训练集,得到k个相互独立的训练集,每次使用一个训练集得到一个模型,k个训练集共得到k个模型,若为分类问题,则将上步得到的k个模型采用投票的方式得到分类结果;若为回归问题,计算上述模型的均值作为最后的结果(所有模型的重要性相同)。
发明内容
本发明公开了一种融合Bagging的XGboost慢性肾病分期预测算法。该算法在XGboost算法基础上,引入Bagging集成学习算法,将许多通过XGboost算法学习到的弱分类器通过一定的规则,组合成一个强分类器。在规则的制定上,引入“投票”机制,即“少数服从多数”原则,每个弱分类器都具有投票权且重要性相同,弱分类器器投出最多票数的类别或者类别之一为最终类别。
附图说明
图1为本发明一种融合Bagging的XGboost慢性肾病分期预测算法的原理图;
图2为本发明Bagging算法实现过程图;
具体实施方式
下面结合附图和实施对本发明进一步说明。
如图1所示,本发明公开了一种融合Bagging的XGboost慢性肾病分期预测算法,该算法在XGboost算法基础上,引入Bagging集成学习算法,通过对原始样本进行k轮集中有放回的抽取训练集,得到k个相互独立的训练集,将每个训练集通过XGboost算法学习到的弱分类器通过一定的规则,组合成一个强分类器。在规则的制定上,引入“投票”机制,即“少数服从多数”原则,每个弱分类器都具有投票权且重要性相同,弱分类器器投出最多票数的类别或者类别之一为最终类别。
图2是本发明Bagging算法实现过程图,通过从原始样本进行k轮集中有放回的抽取训练集,得到k个相互独立的训练集,每次使用一个训练集得到一个模型,k个训练集共得到k个模型,若为分类问题,则将上步得到的k个模型采用投票的方式得到分类结果;若为回归问题,计算上述模型的均值作为最后的结果(所有模型的重要性相同)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于葛晓雪,未经葛晓雪许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810383551.9/2.html,转载请声明来源钻瓜专利网。