[发明专利]一种面向不完备混合数据的增量式特征选择方法在审
申请号: | 202110263764.X | 申请日: | 2021-03-11 |
公开(公告)号: | CN113470826A | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 罗川;唐荣;皮洪;马磊 | 申请(专利权)人: | 四川大学 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G06K9/62 |
代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 郭会 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 完备 混合 数据 增量 特征 选择 方法 | ||
1.一种面向不完备混合数据的增量式特征选择方法,其特征在于,包括:
通过确定并分析不完备混合信息系统中样本集动态增长时特征空间上邻域容差相似类与标签空间上决策等价类的动态更新模式,构造邻域容差信息熵、联合熵、以及条件熵的增量更新机制;将所述增量更新机制引入到启发式特征选择方法中特征重要度的迭代计算过程,设计出基于动态不完备混合决策系统的增量式特征选择方法。
2.根据权利要求1所述的一种面向不完备混合数据的增量式特征选择方法,其特征在于,确定并分析不完备混合信息系统中样本集动态增长时特征空间上邻域容差相似类与标签空间上决策等价类的动态更新模式时包括:
针对不完备混合信息系统中样本集动态增长时,结合增量学习技术综合分析样本集中数据所发生变化,对邻域容差相似类的变化情况进行相应的分析,并提出相应的动态更新模式;同时,分析样本集动态增长时决策等价类变化情况,并提出决策等价类的动态更新模式。
3.根据权利要求2所述的一种面向不完备混合数据的增量式特征选择方法,其特征在于,所述邻域容差信息熵、联合熵、以及条件熵的增量更新机制包括:
当不完备混合数据中数据样本动态增长时,引入增量学习技术以提高特征算法的计算效率;
在求取邻域容差条件熵的增量形式的推导过程中,选用两种方式求取;
其中,第一种方式为直接根据邻域容差条件熵定义推导当多个对象添加到原有数据集时,邻域容差条件熵的增量计算的表现形式;
第二种方式为先依据邻域信息熵和邻域联合熵的增量计算形式,然后依据信息熵和联合熵求得条件熵的增量计算形式;
将两种计算方式所得结果相互对照、验证增量计算形式的正确性。
4.根据权利要求3所述的一种面向不完备混合数据的增量式特征选择方法,其特征在于,所述基于动态不完备混合决策系统的增量式特征选择方法包括:
步骤1.初始化最优特征子集A、候选特征集合C、以及决策特征集D下;
步骤2.计算新增数据集ΔU在最优特征子集A、候选特征集合C、以及决策特征集D下的划分;
步骤3.计算新增数据集ΔU后,增量式计算所有数据在最优特征子集A、候选特征集合C、以及决策特征集D下的划分;
步骤4.计算NTEU∪ΔU(D|C),NTEU∪ΔU(D|A);
步骤5.判断在最优特征子集A与候选特征集合C下,条件熵的值是否相等,如果相等则进入步骤8,否则,进入步骤6;
步骤6.选取候选特征子集C-A中外部重要度最大的特征,并且将所选特征添加于最优特征子集A中,直到所得到的最优特征子集A下条件熵的值等于候选特征集合C下条件熵的值;
步骤7.计算最优特征子集A中各个特征相对于所选最优特征子集A内部属性重要度值,删除最优特征子集A中内部重要度为0的特征;
步骤8.输出特征选择算法得到的最优特征子集A。
5.根据权利要求4所述的一种面向不完备混合数据的增量式特征选择方法,其特征在于,所述步骤2中:
当新增数据集ΔU添加到原始数据中时,是根据邻域容差相似关系计算新增数据集ΔU在最优特征子集A、候选特征集合C、以及决策特征集D下的划分结果;
则若给定的一个不完备混合决策系统IDS=(U,C∪D,V,f),U={x1,x2,...,xn},新增数据集ΔU={xn+1,xn+2,...,xn+n′},则新增数据ΔU在最优特征子集A、候选特征集合C以及决策特征集D下的对象划分如下:
ΔU/NTδ(A)={NTA(xi)|i=n+1,n+2,...,n+n′};
ΔU/NTδ(C)={NTC(xi)|i=n+1,n+2,...,n+n′};
ΔU/NTδ(D)={NTD(xi)|i=n+1,n+2,...,n+n′};
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110263764.X/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置