[发明专利]一种特征属性约简方法在审
申请号: | 202111005912.4 | 申请日: | 2021-08-30 |
公开(公告)号: | CN113780388A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 刘瑶;乔付;郝博麟;刘忠艳;彭增焰;姜微 | 申请(专利权)人: | 岭南师范学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 哈尔滨龙科专利代理有限公司 23206 | 代理人: | 李长春 |
地址: | 524048 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 属性 方法 | ||
本发明公开了一种特征属性约简方法,属于模式识别和机器学习领域,从条件属性集合中移除一个特征属性时,通过计算依赖度的变化得到该特征属性重要性的度量,依赖度的变化越高,该特征属性就越重要,再通过比较特征属性集产生的等价关系,删除特征属性使约简集能够提供与原始的决策属性具有相同的预测能力,该特征属性约简集合为条件特征属性集的最小基数子集,该特征属性约简方法能为特征属性提取算法降低时间和空间复杂度。
技术领域
本发明属于机器学习、模式识别和信号处理领域,特指特征属性提取。
技术背景
特征属性提取是指选择那些最能预测给定结果的输入属性或特征,在机器学习、模式识别和信号处理等许多领域都遇到的问题,与其他降维方法不同,特征属性约简在降维后仍然保留属性的原始含义,这种方法应用于涉及包含大量属性(数万个数量级)的数据集的任务中,对于一些学习算法来说,这些属性可能无法进一步处理,因此,提供一种特征属性约简方法降低学习算法的时间和空间复杂度。
发明内容
本发明的目的是提供一种特征属性约简方法,以解决模式识别和机器学习领域中特征提取问题。
本发明的方法从条件属性集合中移除一个特征属性时,通过计算依赖度的变化得到该特征属性重要性的度量,依赖度的变化越高,该特征属性就越重要,再通过比较特征属性集产生的等价关系,删除特征属性使约简集能够提供与原始的决策属性具有相同的预测能力,该特征属性约简集合为条件特征属性集的最小基数子集。
本发明为实现上述目的,采取的技术方案如下:
一种特征属性约简方法,该方法具体为:一个信息系统表示为:
DT=U,A (1)
式(1)中,全域U是一个非空有限样本集{x1,x2,L xn},A是一个特征属性集合{a1,a2,L am},n和m是任意自然数;
当任意的条件特征属性时,有一个相关的等价关系IND(C)表示为:
U/IND(C)称为由IND(C)产生的划分,可计算为:
式(3)中的操作用任意两个集合A和B来定义:
令:(x,y)∈IND(C),则不能用条件特征属性C来区分x和y,可以用[x]C表示条件特征属性C不可分属性的等价类。
令:X可以近似使用仅包含条件特征属性C的信息,并通过构造条件特征属性C的上、下近似来近似X,计算如下:
令:条件特征属性C和决策属性D是全域U上的等价关系,则正区域、负区域和边界区域定义为:
式(7)表示正区域使用条件特征属性C的信息,能把全域U中的对象分为U/D类的集合,式(8)表示负区域使用条件特征属性C的信息,不能把全域U中的对象分为U/D类的集合,式(9)表示边界区域使用条件特征属性C的信息,可能但不确定把全域U中的对象分为U/D类的集合。
决策属性D对条件特征属性C的依赖度表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于岭南师范学院,未经岭南师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111005912.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种驾驶员多特征融合的疲劳状态检测方法及装置
- 下一篇:发光器件及显示面板