[发明专利]一种基于最优AUC的多机器学习模型特征选择方法在审
申请号: | 202210380302.0 | 申请日: | 2022-04-12 |
公开(公告)号: | CN114724715A | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 陈建新;黄湘君;周亮;李昂;许景艳;蒋冲 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H30/20;G06V10/771;G06V10/764;G06K9/62;G06N20/00 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 张玉红 |
地址: | 210023 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 最优 auc 机器 学习 模型 特征 选择 方法 | ||
1.一种基于最优AUC的多机器学习模型特征选择方法,其特征在于,所述方法的步骤为:
步骤1、针对医学图像提取影像组学特征,输入影响组学特征数据集,对所有输入的特征进行预处理;
步骤2、选择多种机器学习模型交叉组合进行进一步的特征筛选模型构建,迭代计算每一个高重现性特征子集的影像组学模型AUC;
步骤3、对AUC结果进行比较,选取最优AUC,获得最优高重现性特征集,并将AUC结果生成可视化热力图。
2.根据权利要求1所述的一种基于最优AUC的多机器学习模型特征选择方法,其特征在于,步骤1中,对所有输入的特征进行预处理,包括缺失值、异常值的处理及数据分布调整;
其中,对缺失值的处理采用插补法,使用缺失值所在特征列的平均特征值来填充;异常值的认定采用3δ原则,当数据服从正态分布时,根据正态分布的定义可知,样本距离平均值3δ之外的概率为:
P(|x-μ|3δ)=0.003
其中P表示样本满足括号内条件的概率,x表示样本值,μ表示样本均值,δ表示样本标准差;当样本值与样本均值的距离大于3δ,认定为异常值,将异常值视为缺失值,采用处理缺失值的方法进行异常值的处理;
分布调整采用Z-Score标准化,可以将数据转换为正态分布,转化公式为:
其中x*表示转换为正态分布后的样本值,x表示原始样本值,表示原始数据的均值,σ表示原始数据的标准差。
3.根据权利要求1所述的一种基于最优AUC的多机器学习模型特征选择方法,其特征在于,步骤2中,N种机器学习模型两两交叉组合后形成N2种组合特征选择分类器,每一种组合特征选择分类器的输出结果为当前模型组合方式下获得的最大AUC和候选最优高重现性特征集。
4.根据权利要求3所述的一种基于最优AUC的多机器学习模型特征选择方法,其特征在于,步骤2中,每一种组合特征选择分类器都对影像组学特征进行两轮筛选,在第一轮筛选中,使用N种机器学习模型作为外部迭代,训练包含所有影像组学特征的特征筛选模型X来预测PFS和OS,获得各影像组学特征的权重和低维度高重现性特征子集;
在第二轮筛选中,根据第一轮筛选所得到的子集中的特征权重,使用N种机器学习模型作为内部迭代,训练特征分类模型Y,每一次分类结果为一个高重现性特征次子集。
5.根据权利要求4所述的一种基于最优AUC的多机器学习模型特征选择方法,其特征在于,每一次内部迭代都会计算所获得的高重现性特征次子集预测PFS和OS结果的AUC;N种机器学习模型内部迭代结束后,会分别获得xi-y1,xi-y2,…,xi-yN(i∈N)组合方式下的共计N个AUC,比较获得1个最大AUC以及对应的候选最优高重现性特征集和对应的组合特征选择分类器后,进入下一轮外部迭代。
6.根据权利要求4所述的一种基于最优AUC的多机器学习模型特征选择方法,其特征在于,每一次外部迭代包含N次内部迭代,会获得1个当前外部迭代模型下的最大AUC以及对应的候选高重现性特征集和对应的组合特征选择分类器;N种机器学习模型外部迭代结束后,会分别获得x1-yi,x2-yj,…,xN-yz(i,j,…,z∈N)组合方式下共计N个AUC结果以及对应的候选高重现性特征集和对应的组合特征选择分类器。
7.根据权利要求1所述的一种基于最优AUC的多机器学习模型特征选择方法,其特征在于,步骤3中,进行对比择优的N个AUC是外部迭代的最终结果,其中最大AUC即为所需的结果,其对应特征集即最优高重现性特征集,对应的组合特征选择分类器即最优组合方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210380302.0/1.html,转载请声明来源钻瓜专利网。