[发明专利]一种基于Stacking框架的特征选择方法在审
申请号: | 202110679793.4 | 申请日: | 2021-06-18 |
公开(公告)号: | CN113535694A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 王海荣;薛伟伟 | 申请(专利权)人: | 北方民族大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06N20/20;G16H50/20 |
代理公司: | 西安研创天下知识产权代理事务所(普通合伙) 61239 | 代理人: | 郭璐 |
地址: | 750021 宁夏回族*** | 国省代码: | 宁夏;64 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 stacking 框架 特征 选择 方法 | ||
1.一种基于Stacking框架的特征选择方法,其特征在于,包括以下步骤:
步骤1:对输入的疾病数据进行清洗,分析各特征维度数据缺失情况并进行填充,并对数据进行标准化处理,得到更加规范的用于机器学习的数据集;
步骤2:使用K-Fold交叉验证方式训练Stacking集成学习模型,并将步骤1得到的数据集输入到所述Stacking集成学习模型中进行训练,得到特征因子影响矩阵;
步骤3:利用特征选择算法对所述特征因子影响矩阵进行选择,不断迭代删除冗余特征,最终输出分类器全局最高精确率和所对应的最优特征子集;
步骤4:根据步骤3得到的最优特征子集构建基于Stacking框架的疾病诊断模型。
2.根据权利要求1所述的一种基于Stacking框架的特征选择方法,其特征在于,步骤2中所述的Stacking集成学习模型分为两层架构:第一层组合不同的基学习器,包括全连接神经网络和支持向量机;第二层为元学习器,其采用逻辑回归LR,且元学习器以第一层的预测结果作为元学习器的输入,并对最终的结果进行预测,模型构建过程中,为了减少过拟合,利用K-Fold方法交叉训练基学习器。
3.根据权利要求1所述的一种基于Stacking框架的特征选择方法,其特征在于,步骤3的具体操作步骤包括:
步骤31:利用基学习器中的全连接神经网络模型对特征集中的特征进行分析得到权重矩阵;
步骤32:利用基学习器中的支持向量机模型对特征集中的特征进行分析得到特征系数;
步骤33:利用元学习器LR模型分析回归系数,得到回归系数矩阵,根据回归系数矩阵为各基学习器影响因子赋予权重,对基学习器各特征影响因子加权求和,得到特征因子影响矩阵;
步骤34:采用序列后向搜索算法进行特征选择,最终输出最大精确率以及与其相对应的最优特征子集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方民族大学,未经北方民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110679793.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:中心静脉插管用导管鞘及辅助装置
- 下一篇:一种便捷的笛架筒