[发明专利]一种基于参考点非支配排序遗传算法的多目标特征选择方法及系统在审
申请号: | 202011009918.4 | 申请日: | 2020-09-23 |
公开(公告)号: | CN112183608A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 何发智;舒凌轩;胡训;李浩然 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/2458;G06N3/12;G06N20/00 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 参考 支配 排序 遗传 算法 多目标 特征 选择 方法 系统 | ||
1.一种基于参考点非支配排序遗传算法的多目标特征选择方法,其特征在于,包括:
S1:对于输入数据集,采用全局优化算法来寻找一组帕累托子集,其中,一组帕累托子集为特征选择的一组最优解,为一组特征子集,全局优化算法为参考点非支配排序遗传算法,以相关性、互补性、分类精度、冗余度和特征数量为优化目标,使得相关性、互补性和分类精度最大,并使得冗余度和特征数量最小;
S2:计算帕累托子集的最佳分类精度值,并基于最佳精度值和预设参数δ找出δ准等信息子集,根据找出的δ准等信息子集消除劣等子集,得到最终的目标δ准等信息子集,其中,δ准等信息子集用以表示与步骤S1中得到的特征子集的一个分类性能相近的子集,目标δ准等信息子集包含选择出的目标特征。
2.如权利要求1所述的多目标特征选择方法,其特征在于,S1具体包括:
S1.1:将输入数据集分划为训练集和测试集;
S1.2:采用参考点非支配排序遗传算法初始化种群;
S1.3:在算法的每次迭代中计算每个个体的相关性、互补性、分类精度、冗余度和特征数量五个目标值,并利用这些目标值对种群进行更新,其中,每个个体对应一个特征;
S1.4:算法结束迭代后得到一组关于相关性、互补性和分类精度、冗余度和特征数量五个目标值的一组帕累托有效解A,将其作为特征子集。
3.如权利要求1所述的多目标特征选择方法,其特征在于,S2具体包括:
S2.1:计算S1中得到的一组特征子集的最佳分类精度值,最佳分类精度值为分类精度的最大值;
S2.2:根据对分类性能的预期值设定预设参数δ,其中,预设参数δ用以衡量一个子集与S1中得到的特征子集是否具有相近的分类性能;
S2.3:基于最佳分类精度值和预设参数δ判断基准子集是否为步骤S1中的特征子集的δ准等信息子集,判断方法为:如果0=δ=1时,f(Si)=(1-δ)f(Sj),则子集Si与子集Sj具有准同等的信息量,筛选出δ准等信息子集,f表示分类性能指标f,f(Si)表示子集Si的最佳分类精度值,f(Sj)表示子集Sj的最佳分类精度值;
S2.4:如果一个准等信息子集Sk被另一个准等信息子集Sp包含,并且Sk的分类精度值小于Sp,那么Sk被判定为劣等子集,将其消除,得到最终的目标δ准等信息子集。
4.一种基于参考点非支配排序遗传算法的多目标特征选择系统,其特征在于,包括:
特征子集选择模块,用于对于输入数据集,采用全局优化算法来寻找一组帕累托子集,其中,一组帕累托子集为特征选择的一组最优解,为一组特征子集,全局优化算法为参考点非支配排序遗传算法,以相关性、互补性、分类精度、冗余度和特征数量为优化目标,使得相关性、互补性和分类精度最大,并使得冗余度和特征数量最小;
目标特征选择选择模块,用于计算帕累托子集的最佳分类精度值,并基于最佳精度值和预设参数δ找出δ准等信息子集,根据找出的δ准等信息子集消除劣等子集,得到最终的目标δ准等信息子集,其中,δ准等信息子集用以表示与步骤S1中得到的特征子集的一个分类性能相近的子集,目标δ准等信息子集包含选择出的目标特征。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被执行时实现如权利要求1至3中任一项权利要求所述的方法。
6.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至3中任一项权利要求所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011009918.4/1.html,转载请声明来源钻瓜专利网。