[发明专利]基于改进粒子群算法的数据特征选择方法及系统在审

专利信息
申请号: 201810844459.8 申请日: 2018-07-27
公开(公告)号: CN109145960A 公开(公告)日: 2019-01-04
发明(设计)人: 周风余;陈科;尹磊;王玉刚;万方;汪佳宇;边钧健;刘进 申请(专利权)人: 山东大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 李琳
地址: 250061 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 粒子群算法 特征子集 质量评价函数 分类器模型 数据特征 特征选择 改进 处理数据 惯性权重 评估特征 数据集中 选择结果 粒子群 适应度 混沌 子集 粒子 图谱 分类 更新
【说明书】:

发明公开了一种基于改进粒子群算法的数据特征选择方法及系统,包括以下步骤:确定评估特征子集的分类器模型;以分类器模型的正确分类率指导特征选择,逐步加入特征子集个数共同指导特征的选择,建立特征子集的质量评价函数;确定数据集中特征选择标准;对粒子群算法进行改进,根据建立的特征子集质量评价函数,计算粒子群中每一个粒子的适应度值,采用Logistic混沌图谱更新粒子群算法的惯性权重,以改进后的粒子群算法处理数据集,得到选择结果。

技术领域

本发明涉及一种基于改进粒子群算法的数据特征选择方法及系统。

背景技术

随着信息产业和科学技术的快速发展,数据量的积累也越来越多。面对快速增长的数据,快速且高效的挖掘出有用的数据特征为社会发展助力,已经成为一个亟需解决的关键问题。特征选择具有降低数据维度、提高模型性能、减少过拟合和增强数据间连接等优点,可以最大程度的解决数据挖掘问题,提取出价值较高的特征,从而挖掘出隐藏在数据中的有用信息。特征选择的目的是在不降低分类器精度的情况下,最大程度的去除不相关和冗余的数据特征,即从原始数据集中找出最佳的特征子集。特征选择是机器学习、数据挖掘和模式识别领域中重要的数据预处理技术,现已广泛应用于文本分类、人脸识别、推荐系统和故障诊断等众多应用中。在分类系统中,大量不相关或冗余数据的存在,势必增加分类任务的计算复杂度,并在一定程度上降低分类器的分类精度。因此,在解决分类任务时,需要运用特征选择技术选出最佳特征子集,从而最大程度的提升分类器的分类性能和降低任务的计算成本。

特征选择是一个具有挑战性的问题,因为特征之间存在相互影响。换句话说,当单个相关特征与其它特征进行组合时,该特征有可能变为冗余或者可用性较低的特征。因此,原始数据集中的最佳特征子集应该是一组互补的数据特征。

粒子群算法被证明是具有较强全局搜索能力的算法,在解决特征选择问题的研究中表现出了较好的潜力。但是,粒子群算法的性能易受自身参数设置的影响,存在过早收敛、缺乏多样性和易陷入局部最优等问题。

发明内容

本发明为了解决上述问题,提出了一种基于改进粒子群算法的数据特征选择方法及系统,本发明通过引入Logistic混沌图谱、动态修正因子和螺旋形策略来影响粒子的运行轨迹,以增强各粒子间信息的传递和搜索过程中的多样性。通过本发明提出的优化策略能够较大幅度的提升算法的收敛速度和收敛精度,可以更好的解决特征选择问题。

为了实现上述目的,本发明采用如下技术方案:

一种基于改进粒子群算法的数据特征选择方法,包括以下步骤:

确定评估特征子集的分类器模型;

以分类器模型的正确分类率指导特征选择,逐步加入特征子集个数共同指导特征的选择,建立特征子集的质量评价函数;

确定数据集中特征选择标准;

对粒子群算法进行改进,根据建立的特征子集质量评价函数,计算粒子群中每一个粒子的适应度值,采用Logistic混沌图谱更新粒子群算法的惯性权重,以改进后的粒子群算法处理数据集,得到选择结果。

进一步的,使用K最近邻作为评估所选特征子集的分类器模型,同时采用十折交叉验证法来避免样本分布的不均衡问题。

进一步的,对数据集进行随机划分,一部分作为训练样本,另一部分作为测试样本,进行分别测试,将得到的结果求平均,得到特征子集在分类器模型上得出的正确分类率。

进一步的,利用自适应调整策略指导特征子集的选择,一开始依靠正确分类率高来指导特征选择,随着选择过程的继续,逐渐加入特征子集个数少这一指标来共同指导特征的选择。

进一步的,确定数据集中特征选择标准为确定粒子种群的粒子位置范围,以各粒子的位置来决定相应的特征的选中和不选中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810844459.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top