[发明专利]一种基于邻域粗糙集属性约简算法的数据检测方法在审
申请号: | 202211624388.3 | 申请日: | 2022-12-15 |
公开(公告)号: | CN115935168A | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 彭小利;王平;龚远林;王成;蒲宬亘;钱洁;陈伟琪 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F18/213 | 分类号: | G06F18/213 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 王海军 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 邻域 粗糙 属性 算法 数据 检测 方法 | ||
1.一种基于邻域粗糙集属性约简算法的数据检测方法,其特征在于,包括:获取待检测样本,待检测样本包括决策属性集和邻域半径;对决策属性集中的属性进行筛选,得到候选属性子集;跟据邻域半径采用快速邻域搜索机制对候选属性子集中的数据进行处理,将处理后的数据进行存储,当候选属性子集中所有的数据处理完成,输出存储的数据。
2.根据权利要求1所述的一种基于邻域粗糙集属性约简算法的数据检测方法,其特征在于,对决策属性集中的属性进行筛选的过程包括:跟据决策属性集中的数据属性对数据进行划分,划分的标准为样本数据中的属性数量;若只存在一个属性,则将该样本数据划分为单属性样本数据;若存在两个及两个以上的属性,则该样本数据划分为多属性样本数据;将单属性样本数据和多属性样本数据作为候选属性子集。
3.根据权利要求1所述的一种基于邻域粗糙集属性约简算法的数据检测方法,其特征在于,采用快速邻域搜索机制对候选属性子集中的数据进行处理的过程包括:
S1、初始化非冗余属性子集
S2、跟据候选数据集中的数据为非冗余属性子集添加候选属性;
S3、采用快速邻域搜索机制对非冗余属性子集中的属性进行计算,得到其中,B{ai}表示属性集合B并上ai后生成的新的集合;表示样本xj在B{ai}下生成的δ-邻域;
S4、对内的所有样本标签进行判断,若所有样本标签一致,则该样本为正域样本,且POSi←POSi{xj};否则该样本为边界域样本;其中,POSi表示B{ai}关于决策属性D的正域,D为论域U的决策属性;
S5、获取最大POSi所对应的属性,并将该属性添加到非冗余属性子集B中;
S6、确定候选数据集中的数据是否处理完,若处理完则输出非冗余属性子集B,否则返回步骤S2。
4.根据权利要求3所述的一种基于邻域粗糙集属性约简算法的数据检测方法,其特征在于,快速邻域搜索机制包括单属性下的快速邻域搜索机制和多属性下的快速邻域搜索机制。
5.根据权利要求4所述的一种基于邻域粗糙集属性约简算法的数据检测方法,其特征在于,采用单属性下的快速邻域搜索机制对数据进行处理的过程包括:跟据候选属性集中的单属性对样本进行升序排序,计算排序后的每个样本的邻域;计算样本的邻域的过程包括令δB{xj}=δB{xj-1},搜索δB{xj}的左边界BLj,并删除δB{xj}中BLj左边的样本;搜索δB{xj}边界外样本Boutj,将Boutj之前且不在δB{xj}中的样本加入δB{xj}。
6.根据权利要求4所述的一种基于邻域粗糙集属性约简算法的数据检测方法,其特征在于,采用多属性下的快速邻域搜索机制对数据进行处理的过程包括:对每个属性ai∈C-B,令计算内的每个样本xk与xj的距离若则将中的xk删除;重复上述过程,直到内无检测样本;当C-B中无候选样本时,输出其中,C为论域U的条件属性,B为C的子集,C-B表示C和B做减法操作;表示属性集B{ai}下样本xk与xj之间的距离。
7.根据权利要求6所述的一种基于邻域粗糙集属性约简算法的数据检测方法,其特征在于,每个样本xk与xj的距离的表达式为
其中,s为B中的属性个数,ak和ai分别为第k和第i个属性,f(x,ak)表示样本x对应属性ak的值,f(x,ai)表示样本x对应ai属性的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211624388.3/1.html,转载请声明来源钻瓜专利网。