[发明专利]一种用于冠心病数据的核极限学习机及随机森林分类方法有效
申请号: | 201711399080.2 | 申请日: | 2017-12-22 |
公开(公告)号: | CN108108762B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 王丹;石智强;杜金莲;付利华;赵文兵;杜晓林;苏航 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/00;G06N20/00;G16H50/20;G16H50/70 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 冠心病 数据 极限 学习机 随机 森林 分类 方法 | ||
本发明公开一种用于冠心病数据的核极限学习机及随机森林分类方法,采用Bootstrap方法对冠心病样本集进行有放回的采样,生成不同的冠心病数据训练子集和测试子集以供基分类器使用;采用混合核形式的核函数作为核极限学习机的核函数,减少核类型对分类模型的性能影响;使用冠心病数据训练子集对核极限学习机进行模型训练并使用测试子集对基分类器进行性能测试,采用排序加粒子群优化的方式循环判断重新生成优化的新基分类器,剔除并代替分类性能较差的基分类器,从而达到提高整体分类性能的目的;形成随机森林模型之后,采用相对多数投票法选取分类结果。
技术领域
本发明属于计算机软件领域,尤其涉及一种用于冠心病数据分类的基于核极限学习机及并行化的随机森林分类方法。
背景技术
医疗资料显示,冠心病已经成为危害人类健康最严重的疾病之一。冠心病的一个特点是很难事先做出准确的诊断,但其发生和发展的规律有一定的规律可循。在机器学习技术中,冠心病的诊断本质上是一个分类问题,随着机器学习技术在医疗领域中的发展与应用,人们希望借助机器学习技术和方法辅助对冠心病等复杂疾病的诊断,避免医生在诊断过程中由于经验不足导致的误诊,得到更准确的诊断结果,帮助医生建立临床辅助决策模型,为其在临床应用中提供科学依据。
从研究人员利用不同的模型对冠心病数据分类的结果显示,基于SVM和神经网络的模型表现出较好的分类性能。但是仍然存在如下一些问题。第一,对于SVM和神经网络,很典型的一个难题是模型的参数选择问题,参数的选择对分类结果有很大的影响,而且参数的选择没有统一的标准和理论指导;第二,已存在的很多方法都采用单分类模型,分类性能往往会受到单分类器性能的限制而达到瓶颈,第三,典型人工神经网络模型复杂且训练速度慢。
极限学习机(ELM)比SVM和神经网络具有更优的性能,它的优点在于只含有一个隐藏层,输入层与隐藏层的网络权重值和偏倚值随机产生,而隐藏层和输出层之间的输出权重直接计算求出,不需要迭代调节网络权重,避免了梯度下降法产生的局部极值、学习时间长及学习率低的影响等问题,因此训练速度非常快。但是,由于极限学习机的隐藏层节点数目是随机给定的,而实际实验显示隐藏层节点数目的选取很大程度上决定了神经网络的分类精度是否可最优。换言之,就是极限学习机的神经元数目直接关系到神经网络的系统逼近与泛化性能。随机产生输入层与隐藏层的网络权重值和偏倚值导致极限学习机对未在训练集中出现的样本泛化能力差、输出结果不稳定等缺点,需要大量的隐藏层节点才能达到理想的精度。为了进一步提高极限学习机的泛化能力和稳定性,黄广斌等人在极限学习机中引入核函数,形成核极限学习机(KELM),避免了随机产生的输入权重和偏倚值的问题,使极限学习机的泛化能力更强,更稳定。同时,我们也发现,目前大多数的预测分类模型在医疗领域中还不能完全摆脱人工干预,因为分类精度不够高。如果充分利用海量的数据支持可以提高分类精度,特别是对神经网络来说,数据规模越大,神经网络性能就越强。但是,单机是无法处理海量数据的,因此,还要进一步对分类系统进行并行化来解决能够处理海量数据的问题。
随机森林算法是一种用于分类,回归和其他任务的集成学习方法,它由多个弱基分类器组成。它在运算量没有显著增加的前提下提高了预测精度。它对多元公线性不敏感,结果对缺失数据和非平衡的数据比较稳健,可以很好地预测多达几千个解释变量的作用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711399080.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种快速人脸识别方法
- 下一篇:脑电分类模型生成方法、装置及电子设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置