[发明专利]一种基于邻域粗糙集属性约简算法的数据检测方法在审

专利信息
申请号: 202211624388.3 申请日: 2022-12-15
公开(公告)号: CN115935168A 公开(公告)日: 2023-04-07
发明(设计)人: 彭小利;王平;龚远林;王成;蒲宬亘;钱洁;陈伟琪 申请(专利权)人: 重庆邮电大学
主分类号: G06F18/213 分类号: G06F18/213
代理公司: 重庆辉腾律师事务所 50215 代理人: 王海军
地址: 400065 重*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 邻域 粗糙 属性 算法 数据 检测 方法
【说明书】:

发明属于数据分析处理技术领域,具体涉及一种基于邻域粗糙集属性约简算法的数据检测方法,该方法包括:获取待检测样本,待检测样本包括决策属性集和邻域半径;对决策属性集中的属性进行筛选,得到候选属性子集;跟据邻域半径采用快速邻域搜索机制对候选属性子集中的数据进行处理,将处理后的数据进行存储,当候选属性子集中所有的数据处理完成,输出存储的数据;本发明提供的多属性下的快速邻域计算方法,可适用于任何多属性下的邻域计算,减小了邻域计算中的邻域搜索范围,提高了多属性下的邻域计算效率。

技术领域

本发明属于数据分析处理技术领域,具体涉及一种基于邻域粗糙集属性约简算法的数据检测方法。

背景技术

随着社会的不断发展,人民群众对医疗的需求不断增长,然而现有的医疗资源分配不均、医疗资源匮乏成为一大社会矛盾。传统医疗完全依靠医生综合分析病人的多种仪器和设备的检查和检验项目做出病情诊断,整个诊断周期持续时间长。人工智能辅助医疗是人工智能的重要应用,借助人工智能机器学习、医学图像处理、深度学习等技术,提高医学诊断的效率,是缓解当前医疗诊断效率低下的重要手段。

医疗数据中存在对病情诊断冗余或不相关的属性,这些属性的存在甚至会降低最终诊断结果的准确性。属性约简也叫特征选择,是保持分类器分类性能不变的情况下消除冗余和不相关属性的重要方法。邻域粗糙集属性约简是属性约简中一种常用的方法。其使用样本之间的邻域关系来判断样本的是否可以被正确分类。然而传统邻域计算中,求解每个样本的邻域时需要计算该样本和论域内所有样本之间的关系。假设论域内有n个样本,则每个样本需要计算n次,那么n个样本就需要计算n2次。每加入一个新的属性到当前距离对应的属性集中时,n个样本都需要重新计算n2次。这使得传统邻域系统的计算量非常大,计算效率很低。

如何减小邻域的计算量以提高属性约简效率和同时也提高预测精度是目前亟待解决的问题。其中粒球邻域粗糙集属性约简算法GBNRS、权重邻域粗糙集属性约简算法WNRS等可以较好的解决上述问题。例如夏等人认为邻域粗糙集效率低下的主要原因在于邻域半径参数δ需要寻优;为此,他们提出了一种自适应粒球邻域粗糙集,采用聚类的方式自动生成粒球,并采用后向属性约简策略,但该方法在大样本量的数据集上表现较为优秀。WNRS采用空间换时间的方法提高邻域计算的效率,但该方法在样本量较大的数据集上会因为消耗内存太大而无法运行。

发明内容

为解决以上现有技术存在的问题,本发明从邻域粗糙集属性约简出发,减小邻域计算量的关键在于减小邻域的搜索范围,当前的邻域计算还有很大的加速空间,这使得邻域粗糙集属性约简的效率进一步提升。

本发明提出了一种基于邻域粗糙集属性约简算法的数据检测方法,该方法包括:获取待检测样本,待检测样本包括决策属性集和邻域半径;对决策属性集中的属性进行筛选,得到候选属性子集;跟据邻域半径采用快速邻域搜索机制对候选属性子集中的数据进行处理,将处理后的数据进行存储,当候选属性子集中所有的数据处理完成,输出存储的数据。

优选的,对决策属性集中的属性进行筛选的过程包括:跟据决策属性集中的数据属性对数据进行划分,划分的标准为样本数据中的属性数量;若只存在一个属性,则将该样本数据划分为单属性样本数据;若存在两个及两个以上的属性,则该样本数据划分为多属性样本数据;将单属性样本数据和多属性样本数据作为候选属性子集。

优选的,采用快速邻域搜索机制对候选属性子集中的数据进行处理的过程包括:

S1、初始化非冗余属性子集

S2、跟据候选数据集中的数据为非冗余属性子集添加候选属性;

S3、采用快速邻域搜索机制对非冗余属性子集中的属性进行计算,得到

S4、对内的所有样本标签进行判断,若所有样本标签一致,则该样本为正域样本,且POSi←POSi∪{xj};否则该样本为边界域样本;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211624388.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top