[发明专利]结合懒惰学习和急切学习的层次特征选择方法及系统在审
申请号: | 202210365573.9 | 申请日: | 2022-04-08 |
公开(公告)号: | CN114818884A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 吴全旺;李德辉;邹东升;周尚波;房剑钊 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 重庆信必达知识产权代理有限公司 50286 | 代理人: | 刘会锋 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结合 懒惰 学习 急切 层次 特征 选择 方法 系统 | ||
1.一种结合懒惰学习和急切学习的层次特征选择方法,其特征在于,所述结合懒惰学习和急切学习的层次特征选择方法包括以下步骤:
步骤一,结合懒惰学习和急切学习构建层次特征选择算法LE-HFS;
步骤二,通过两类互补方式的融合改进层次特征选择;
步骤三,LE-HFS在懒惰学习和急切学习过程中分别使用LazyR和信息增益作为相关性度量,从不同的相关性角度进行综合性特性选择。
2.如权利要求1所述的结合懒惰学习和急切学习的层次特征选择方法,其特征在于,所述步骤三中的LazyR和信息增益相关性度量包括:信息增益用于衡量在给定某个条件下信息复杂度减少的程度;计算增加一个特征fi作为已知信息后,标签C的复杂度变化,衡量此特征和标签之间的相关性;以H(C)表示标签C的信息熵,H(C|fi)表示给定fi后C的条件熵,则信息增益的计算如下式所示:
IG(C,fi)=H(C)-H(C|fi);
LazyR度量标准用于以给定的特定值x评估给定特征fi的预测能力,计算公式如下所示:
式中,cj为第j个类标签,k为类标签的总个数。
3.如权利要求1所述的结合懒惰学习和急切学习的层次特征选择方法,其特征在于,所述信息增益评估特征与类标签之间的相关性;在懒惰学习场景下,分析给定测试实例的特征值,识别特定实例的高质量的特征子集。
4.如权利要求1所述的结合懒惰学习和急切学习的层次特征选择方法,其特征在于,所述LazyR为在给定特征fi取值为特定值x时,将fi与类标签的相关性计算为每个类别的条件概率P(cj|x)与均匀分布时的条件概率1/k之间的差异的平方和;当特征值x与某个类别完全相关时,度量值最大,而当每个类别cj在给定x时的条件概率都为1/k时,均匀分布,度量值为最小值零,且LazyR对稀疏数据敏感。
5.一种实施权利要求1~4任意一项所述的结合懒惰学习和急切学习的层次特征选择方法的结合懒惰学习和急切学习的层次特征选择系统,其特征在于,所述结合懒惰学习和急切学习的层次特征选择系统包括:
层次特征选择算法构建模块,用于结合懒惰学习和急切学习构建层次特征选择算法LE-HFS;
层次特征选择改进模块,用于通过两类互补方式的融合改进层次特征选择;
综合性特性选择模块,用于LE-HFS在懒惰学习和急切学习过程中分别使用LazyR和信息增益作为相关性度量,从不同的相关性角度进行综合性特性选择。
6.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
结合懒惰学习和急切学习构建层次特征选择方法LE-HFS,通过两类互补方式的融合改进层次特征选择;LE-HFS在懒惰学习和急切学习过程中分别使用LazyR和信息增益作为相关性度量,从不同的相关性角度进行综合性特性选择。
7.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
结合懒惰学习和急切学习构建层次特征选择方法LE-HFS,通过两类互补方式的融合改进层次特征选择;LE-HFS在懒惰学习和急切学习过程中分别使用LazyR和信息增益作为相关性度量,从不同的相关性角度进行综合性特性选择。
8.一种存储在计算机可读介质上的计算机程序产品,包括计算机可读程序,供于电子装置上执行时,提供用户输入接口以应用如权利要求5所述的结合懒惰学习和急切学习的层次特征选择系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210365573.9/1.html,转载请声明来源钻瓜专利网。