[发明专利]一种面向不完备混合数据的增量式特征选择方法在审

专利信息
申请号: 202110263764.X 申请日: 2021-03-11
公开(公告)号: CN113470826A 公开(公告)日: 2021-10-01
发明(设计)人: 罗川;唐荣;皮洪;马磊 申请(专利权)人: 四川大学
主分类号: G16H50/70 分类号: G16H50/70;G06K9/62
代理公司: 四川省成都市天策商标专利事务所 51213 代理人: 郭会
地址: 610000 四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 完备 混合 数据 增量 特征 选择 方法
【权利要求书】:

1.一种面向不完备混合数据的增量式特征选择方法,其特征在于,包括:

通过确定并分析不完备混合信息系统中样本集动态增长时特征空间上邻域容差相似类与标签空间上决策等价类的动态更新模式,构造邻域容差信息熵、联合熵、以及条件熵的增量更新机制;将所述增量更新机制引入到启发式特征选择方法中特征重要度的迭代计算过程,设计出基于动态不完备混合决策系统的增量式特征选择方法。

2.根据权利要求1所述的一种面向不完备混合数据的增量式特征选择方法,其特征在于,确定并分析不完备混合信息系统中样本集动态增长时特征空间上邻域容差相似类与标签空间上决策等价类的动态更新模式时包括:

针对不完备混合信息系统中样本集动态增长时,结合增量学习技术综合分析样本集中数据所发生变化,对邻域容差相似类的变化情况进行相应的分析,并提出相应的动态更新模式;同时,分析样本集动态增长时决策等价类变化情况,并提出决策等价类的动态更新模式。

3.根据权利要求2所述的一种面向不完备混合数据的增量式特征选择方法,其特征在于,所述邻域容差信息熵、联合熵、以及条件熵的增量更新机制包括:

当不完备混合数据中数据样本动态增长时,引入增量学习技术以提高特征算法的计算效率;

在求取邻域容差条件熵的增量形式的推导过程中,选用两种方式求取;

其中,第一种方式为直接根据邻域容差条件熵定义推导当多个对象添加到原有数据集时,邻域容差条件熵的增量计算的表现形式;

第二种方式为先依据邻域信息熵和邻域联合熵的增量计算形式,然后依据信息熵和联合熵求得条件熵的增量计算形式;

将两种计算方式所得结果相互对照、验证增量计算形式的正确性。

4.根据权利要求3所述的一种面向不完备混合数据的增量式特征选择方法,其特征在于,所述基于动态不完备混合决策系统的增量式特征选择方法包括:

步骤1.初始化最优特征子集A、候选特征集合C、以及决策特征集D下;

步骤2.计算新增数据集ΔU在最优特征子集A、候选特征集合C、以及决策特征集D下的划分;

步骤3.计算新增数据集ΔU后,增量式计算所有数据在最优特征子集A、候选特征集合C、以及决策特征集D下的划分;

步骤4.计算NTEU∪ΔU(D|C),NTEU∪ΔU(D|A);

步骤5.判断在最优特征子集A与候选特征集合C下,条件熵的值是否相等,如果相等则进入步骤8,否则,进入步骤6;

步骤6.选取候选特征子集C-A中外部重要度最大的特征,并且将所选特征添加于最优特征子集A中,直到所得到的最优特征子集A下条件熵的值等于候选特征集合C下条件熵的值;

步骤7.计算最优特征子集A中各个特征相对于所选最优特征子集A内部属性重要度值,删除最优特征子集A中内部重要度为0的特征;

步骤8.输出特征选择算法得到的最优特征子集A。

5.根据权利要求4所述的一种面向不完备混合数据的增量式特征选择方法,其特征在于,所述步骤2中:

当新增数据集ΔU添加到原始数据中时,是根据邻域容差相似关系计算新增数据集ΔU在最优特征子集A、候选特征集合C、以及决策特征集D下的划分结果;

则若给定的一个不完备混合决策系统IDS=(U,C∪D,V,f),U={x1,x2,...,xn},新增数据集ΔU={xn+1,xn+2,...,xn+n′},则新增数据ΔU在最优特征子集A、候选特征集合C以及决策特征集D下的对象划分如下:

ΔU/NTδ(A)={NTA(xi)|i=n+1,n+2,...,n+n′};

ΔU/NTδ(C)={NTC(xi)|i=n+1,n+2,...,n+n′};

ΔU/NTδ(D)={NTD(xi)|i=n+1,n+2,...,n+n′};

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110263764.X/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top