[发明专利]一种特征属性约简方法在审

专利信息
申请号: 202111005912.4 申请日: 2021-08-30
公开(公告)号: CN113780388A 公开(公告)日: 2021-12-10
发明(设计)人: 刘瑶;乔付;郝博麟;刘忠艳;彭增焰;姜微 申请(专利权)人: 岭南师范学院
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 哈尔滨龙科专利代理有限公司 23206 代理人: 李长春
地址: 524048 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 特征 属性 方法
【说明书】:

发明公开了一种特征属性约简方法,属于模式识别和机器学习领域,从条件属性集合中移除一个特征属性时,通过计算依赖度的变化得到该特征属性重要性的度量,依赖度的变化越高,该特征属性就越重要,再通过比较特征属性集产生的等价关系,删除特征属性使约简集能够提供与原始的决策属性具有相同的预测能力,该特征属性约简集合为条件特征属性集的最小基数子集,该特征属性约简方法能为特征属性提取算法降低时间和空间复杂度。

技术领域

本发明属于机器学习、模式识别和信号处理领域,特指特征属性提取。

技术背景

特征属性提取是指选择那些最能预测给定结果的输入属性或特征,在机器学习、模式识别和信号处理等许多领域都遇到的问题,与其他降维方法不同,特征属性约简在降维后仍然保留属性的原始含义,这种方法应用于涉及包含大量属性(数万个数量级)的数据集的任务中,对于一些学习算法来说,这些属性可能无法进一步处理,因此,提供一种特征属性约简方法降低学习算法的时间和空间复杂度。

发明内容

本发明的目的是提供一种特征属性约简方法,以解决模式识别和机器学习领域中特征提取问题。

本发明的方法从条件属性集合中移除一个特征属性时,通过计算依赖度的变化得到该特征属性重要性的度量,依赖度的变化越高,该特征属性就越重要,再通过比较特征属性集产生的等价关系,删除特征属性使约简集能够提供与原始的决策属性具有相同的预测能力,该特征属性约简集合为条件特征属性集的最小基数子集。

本发明为实现上述目的,采取的技术方案如下:

一种特征属性约简方法,该方法具体为:一个信息系统表示为:

DT=U,A (1)

式(1)中,全域U是一个非空有限样本集{x1,x2,L xn},A是一个特征属性集合{a1,a2,L am},n和m是任意自然数;

当任意的条件特征属性时,有一个相关的等价关系IND(C)表示为:

U/IND(C)称为由IND(C)产生的划分,可计算为:

式(3)中的操作用任意两个集合A和B来定义:

令:(x,y)∈IND(C),则不能用条件特征属性C来区分x和y,可以用[x]C表示条件特征属性C不可分属性的等价类。

令:X可以近似使用仅包含条件特征属性C的信息,并通过构造条件特征属性C的上、下近似来近似X,计算如下:

令:条件特征属性C和决策属性D是全域U上的等价关系,则正区域、负区域和边界区域定义为:

式(7)表示正区域使用条件特征属性C的信息,能把全域U中的对象分为U/D类的集合,式(8)表示负区域使用条件特征属性C的信息,不能把全域U中的对象分为U/D类的集合,式(9)表示边界区域使用条件特征属性C的信息,可能但不确定把全域U中的对象分为U/D类的集合。

决策属性D对条件特征属性C的依赖度表示为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于岭南师范学院,未经岭南师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111005912.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top