[发明专利]基于改进粒子群算法的数据特征选择方法及系统在审

专利信息
申请号: 201810844459.8 申请日: 2018-07-27
公开(公告)号: CN109145960A 公开(公告)日: 2019-01-04
发明(设计)人: 周风余;陈科;尹磊;王玉刚;万方;汪佳宇;边钧健;刘进 申请(专利权)人: 山东大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 李琳
地址: 250061 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 粒子群算法 特征子集 质量评价函数 分类器模型 数据特征 特征选择 改进 处理数据 惯性权重 评估特征 数据集中 选择结果 粒子群 适应度 混沌 子集 粒子 图谱 分类 更新
【权利要求书】:

1.一种基于改进粒子群算法的数据特征选择方法,其特征是:包括以下步骤:

确定评估特征子集的分类器模型;

以分类器模型的正确分类率指导特征选择,逐步加入特征子集个数共同指导特征的选择,建立特征子集的质量评价函数;

确定数据集中特征选择标准;

对粒子群算法进行改进,根据建立的特征子集质量评价函数,计算粒子群中每一个粒子的适应度值,采用Logistic混沌图谱更新粒子群算法的惯性权重,以改进后的粒子群算法处理数据集,得到选择结果。

2.如权利要求1所述的一种基于改进粒子群算法的数据特征选择方法,其特征是:使用K最近邻作为评估所选特征子集的分类器模型,同时采用十折交叉验证法来避免样本分布的不均衡问题。

3.如权利要求1所述的一种基于改进粒子群算法的数据特征选择方法,其特征是:对数据集进行随机划分,一部分作为训练样本,另一部分作为测试样本,进行分别测试,将得到的结果求平均,得到特征子集在分类器模型上得出的正确分类率。

4.如权利要求1所述的一种基于改进粒子群算法的数据特征选择方法,其特征是:利用自适应调整策略指导特征子集的选择,一开始依靠正确分类率高来指导特征选择,随着选择过程的继续,逐渐加入特征子集个数少这一指标来共同指导特征的选择。

5.如权利要求1所述的一种基于改进粒子群算法的数据特征选择方法,其特征是:确定数据集中特征选择标准为确定粒子种群的粒子位置范围,以各粒子的位置来决定相应的特征的选中和不选中。

6.如权利要求1所述的一种基于改进粒子群算法的数据特征选择方法,其特征是:利用改进的粒子群算法处理数据特征选择的过程包括:

(1)输入需要进行特征选择的数据集;

(2)初始化粒子种群的种群大小、最大迭代次数,并随机初始化粒子个体的初始位置和飞行速度;

(3)根据建立的特征子集质量评价函数,计算粒子群中每一个粒子的适应度值;

(4)初始化粒子群的个体最优位置pbest和全局最优位置gbest;

(5)采用Logistic混沌图谱更新粒子群算法的惯性权重,更新粒子群中每一个粒子的飞行速度;

(6)计算动态修正因子,采用组合位置更新粒子群中粒子的位置;

(7)计算粒子种群中每一个粒子的适应度值,并更新粒子群的个体最优位置pbest和全局最优位置gbest,得到更新问题的最优完整解;

(8)判断粒子群的进化是否到达算法设置的最大迭代次数,若是,停止进化,输出最优完整解作为数据集的最佳特征子集;否则,转入步骤(5)。

7.如权利要求6所述的一种基于改进粒子群算法的数据特征选择方法,其特征是:所述步骤(1)中,对需要进行特征选择的数据进行处理,将其用一个特征向量表示,具体是指将已获得的数据且已知标签的数据,用一条含有许多特征的向量进行表示,向量的每一维都表示该数据集中的一个特征。

8.如权利要求6所述的一种基于改进粒子群算法的数据特征选择方法,其特征是:所述步骤(7)中,对于粒子种群中的任何一个粒子,如果其适应度值优于历史最优位置的适应度值,则将当前粒子的位置作为新的个体最优位置,否则,保持粒子的历史个体最优位置不变;考虑种群的环形拓扑结构,将每个粒子的适应度值与其相邻若干个粒子的适应度值就行比较,并将适应度值较小的粒子作为当前粒子种群的全局最优位置。

9.如权利要求6所述的一种基于改进粒子群算法的数据特征选择方法,其特征是:所述步骤(7)中,比较粒子种群中所有粒子的适应度值,选出适应度值最小的一个粒子的位置,并与当前的最优完整解进行比较,如果其适应度值小于当前最优完整解的适应度值,则用该粒子位置去替换当前的完整解作为新的最优完整解;否则,最优完整解保持不变。

10.一种基于改进粒子群算法的数据特征选择系统,其特征是:运行于处理器或存储器上,被配置为执行以下指令:

确定评估特征子集的分类器模型;

以分类器模型的正确分类率指导特征选择,逐步加入特征子集个数共同指导特征的选择,建立特征子集的质量评价函数;

确定数据集中特征选择标准;

对粒子群算法进行改进,根据建立的特征子集质量评价函数,计算粒子群中每一个粒子的适应度值,采用Logistic混沌图谱更新粒子群算法的惯性权重,以改进后的粒子群算法处理数据集,得到选择结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810844459.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top