[发明专利]一种用于冠心病数据的核极限学习机及随机森林分类方法有效

专利信息
申请号: 201711399080.2 申请日: 2017-12-22
公开(公告)号: CN108108762B 公开(公告)日: 2021-03-16
发明(设计)人: 王丹;石智强;杜金莲;付利华;赵文兵;杜晓林;苏航 申请(专利权)人: 北京工业大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/00;G06N20/00;G16H50/20;G16H50/70
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 张慧
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 冠心病 数据 极限 学习机 随机 森林 分类 方法
【说明书】:

发明公开一种用于冠心病数据的核极限学习机及随机森林分类方法,采用Bootstrap方法对冠心病样本集进行有放回的采样,生成不同的冠心病数据训练子集和测试子集以供基分类器使用;采用混合核形式的核函数作为核极限学习机的核函数,减少核类型对分类模型的性能影响;使用冠心病数据训练子集对核极限学习机进行模型训练并使用测试子集对基分类器进行性能测试,采用排序加粒子群优化的方式循环判断重新生成优化的新基分类器,剔除并代替分类性能较差的基分类器,从而达到提高整体分类性能的目的;形成随机森林模型之后,采用相对多数投票法选取分类结果。

技术领域

本发明属于计算机软件领域,尤其涉及一种用于冠心病数据分类的基于核极限学习机及并行化的随机森林分类方法。

背景技术

医疗资料显示,冠心病已经成为危害人类健康最严重的疾病之一。冠心病的一个特点是很难事先做出准确的诊断,但其发生和发展的规律有一定的规律可循。在机器学习技术中,冠心病的诊断本质上是一个分类问题,随着机器学习技术在医疗领域中的发展与应用,人们希望借助机器学习技术和方法辅助对冠心病等复杂疾病的诊断,避免医生在诊断过程中由于经验不足导致的误诊,得到更准确的诊断结果,帮助医生建立临床辅助决策模型,为其在临床应用中提供科学依据。

从研究人员利用不同的模型对冠心病数据分类的结果显示,基于SVM和神经网络的模型表现出较好的分类性能。但是仍然存在如下一些问题。第一,对于SVM和神经网络,很典型的一个难题是模型的参数选择问题,参数的选择对分类结果有很大的影响,而且参数的选择没有统一的标准和理论指导;第二,已存在的很多方法都采用单分类模型,分类性能往往会受到单分类器性能的限制而达到瓶颈,第三,典型人工神经网络模型复杂且训练速度慢。

极限学习机(ELM)比SVM和神经网络具有更优的性能,它的优点在于只含有一个隐藏层,输入层与隐藏层的网络权重值和偏倚值随机产生,而隐藏层和输出层之间的输出权重直接计算求出,不需要迭代调节网络权重,避免了梯度下降法产生的局部极值、学习时间长及学习率低的影响等问题,因此训练速度非常快。但是,由于极限学习机的隐藏层节点数目是随机给定的,而实际实验显示隐藏层节点数目的选取很大程度上决定了神经网络的分类精度是否可最优。换言之,就是极限学习机的神经元数目直接关系到神经网络的系统逼近与泛化性能。随机产生输入层与隐藏层的网络权重值和偏倚值导致极限学习机对未在训练集中出现的样本泛化能力差、输出结果不稳定等缺点,需要大量的隐藏层节点才能达到理想的精度。为了进一步提高极限学习机的泛化能力和稳定性,黄广斌等人在极限学习机中引入核函数,形成核极限学习机(KELM),避免了随机产生的输入权重和偏倚值的问题,使极限学习机的泛化能力更强,更稳定。同时,我们也发现,目前大多数的预测分类模型在医疗领域中还不能完全摆脱人工干预,因为分类精度不够高。如果充分利用海量的数据支持可以提高分类精度,特别是对神经网络来说,数据规模越大,神经网络性能就越强。但是,单机是无法处理海量数据的,因此,还要进一步对分类系统进行并行化来解决能够处理海量数据的问题。

随机森林算法是一种用于分类,回归和其他任务的集成学习方法,它由多个弱基分类器组成。它在运算量没有显著增加的前提下提高了预测精度。它对多元公线性不敏感,结果对缺失数据和非平衡的数据比较稳健,可以很好地预测多达几千个解释变量的作用。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711399080.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top