[发明专利]基于改进粒子群算法的数据特征选择方法及系统在审
| 申请号: | 201810844459.8 | 申请日: | 2018-07-27 |
| 公开(公告)号: | CN109145960A | 公开(公告)日: | 2019-01-04 |
| 发明(设计)人: | 周风余;陈科;尹磊;王玉刚;万方;汪佳宇;边钧健;刘进 | 申请(专利权)人: | 山东大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李琳 |
| 地址: | 250061 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 粒子群算法 特征子集 质量评价函数 分类器模型 数据特征 特征选择 改进 处理数据 惯性权重 评估特征 数据集中 选择结果 粒子群 适应度 混沌 子集 粒子 图谱 分类 更新 | ||
1.一种基于改进粒子群算法的数据特征选择方法,其特征是:包括以下步骤:
确定评估特征子集的分类器模型;
以分类器模型的正确分类率指导特征选择,逐步加入特征子集个数共同指导特征的选择,建立特征子集的质量评价函数;
确定数据集中特征选择标准;
对粒子群算法进行改进,根据建立的特征子集质量评价函数,计算粒子群中每一个粒子的适应度值,采用Logistic混沌图谱更新粒子群算法的惯性权重,以改进后的粒子群算法处理数据集,得到选择结果。
2.如权利要求1所述的一种基于改进粒子群算法的数据特征选择方法,其特征是:使用K最近邻作为评估所选特征子集的分类器模型,同时采用十折交叉验证法来避免样本分布的不均衡问题。
3.如权利要求1所述的一种基于改进粒子群算法的数据特征选择方法,其特征是:对数据集进行随机划分,一部分作为训练样本,另一部分作为测试样本,进行分别测试,将得到的结果求平均,得到特征子集在分类器模型上得出的正确分类率。
4.如权利要求1所述的一种基于改进粒子群算法的数据特征选择方法,其特征是:利用自适应调整策略指导特征子集的选择,一开始依靠正确分类率高来指导特征选择,随着选择过程的继续,逐渐加入特征子集个数少这一指标来共同指导特征的选择。
5.如权利要求1所述的一种基于改进粒子群算法的数据特征选择方法,其特征是:确定数据集中特征选择标准为确定粒子种群的粒子位置范围,以各粒子的位置来决定相应的特征的选中和不选中。
6.如权利要求1所述的一种基于改进粒子群算法的数据特征选择方法,其特征是:利用改进的粒子群算法处理数据特征选择的过程包括:
(1)输入需要进行特征选择的数据集;
(2)初始化粒子种群的种群大小、最大迭代次数,并随机初始化粒子个体的初始位置和飞行速度;
(3)根据建立的特征子集质量评价函数,计算粒子群中每一个粒子的适应度值;
(4)初始化粒子群的个体最优位置pbest和全局最优位置gbest;
(5)采用Logistic混沌图谱更新粒子群算法的惯性权重,更新粒子群中每一个粒子的飞行速度;
(6)计算动态修正因子,采用组合位置更新粒子群中粒子的位置;
(7)计算粒子种群中每一个粒子的适应度值,并更新粒子群的个体最优位置pbest和全局最优位置gbest,得到更新问题的最优完整解;
(8)判断粒子群的进化是否到达算法设置的最大迭代次数,若是,停止进化,输出最优完整解作为数据集的最佳特征子集;否则,转入步骤(5)。
7.如权利要求6所述的一种基于改进粒子群算法的数据特征选择方法,其特征是:所述步骤(1)中,对需要进行特征选择的数据进行处理,将其用一个特征向量表示,具体是指将已获得的数据且已知标签的数据,用一条含有许多特征的向量进行表示,向量的每一维都表示该数据集中的一个特征。
8.如权利要求6所述的一种基于改进粒子群算法的数据特征选择方法,其特征是:所述步骤(7)中,对于粒子种群中的任何一个粒子,如果其适应度值优于历史最优位置的适应度值,则将当前粒子的位置作为新的个体最优位置,否则,保持粒子的历史个体最优位置不变;考虑种群的环形拓扑结构,将每个粒子的适应度值与其相邻若干个粒子的适应度值就行比较,并将适应度值较小的粒子作为当前粒子种群的全局最优位置。
9.如权利要求6所述的一种基于改进粒子群算法的数据特征选择方法,其特征是:所述步骤(7)中,比较粒子种群中所有粒子的适应度值,选出适应度值最小的一个粒子的位置,并与当前的最优完整解进行比较,如果其适应度值小于当前最优完整解的适应度值,则用该粒子位置去替换当前的完整解作为新的最优完整解;否则,最优完整解保持不变。
10.一种基于改进粒子群算法的数据特征选择系统,其特征是:运行于处理器或存储器上,被配置为执行以下指令:
确定评估特征子集的分类器模型;
以分类器模型的正确分类率指导特征选择,逐步加入特征子集个数共同指导特征的选择,建立特征子集的质量评价函数;
确定数据集中特征选择标准;
对粒子群算法进行改进,根据建立的特征子集质量评价函数,计算粒子群中每一个粒子的适应度值,采用Logistic混沌图谱更新粒子群算法的惯性权重,以改进后的粒子群算法处理数据集,得到选择结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810844459.8/1.html,转载请声明来源钻瓜专利网。





