[发明专利]基于改进粒子群算法的数据特征选择方法及系统在审

申请号：	201810844459.8	申请日：	2018-07-27
公开（公告）号：	CN109145960A	公开（公告）日：	2019-01-04
发明（设计）人：	周风余;陈科;尹磊;王玉刚;万方;汪佳宇;边钧健;刘进	申请（专利权）人：	山东大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	济南圣达知识产权代理有限公司 37221	代理人：	李琳
地址：	250061 山东***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	粒子群算法特征子集质量评价函数分类器模型数据特征特征选择改进处理数据惯性权重评估特征数据集中选择结果粒子群适应度混沌子集粒子图谱分类更新
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于改进粒子群算法的数据特征选择方法，其特征是：包括以下步骤：

确定评估特征子集的分类器模型；

以分类器模型的正确分类率指导特征选择，逐步加入特征子集个数共同指导特征的选择，建立特征子集的质量评价函数；

确定数据集中特征选择标准；

对粒子群算法进行改进，根据建立的特征子集质量评价函数，计算粒子群中每一个粒子的适应度值，采用Logistic混沌图谱更新粒子群算法的惯性权重，以改进后的粒子群算法处理数据集，得到选择结果。

2.如权利要求1所述的一种基于改进粒子群算法的数据特征选择方法，其特征是：使用K最近邻作为评估所选特征子集的分类器模型，同时采用十折交叉验证法来避免样本分布的不均衡问题。

3.如权利要求1所述的一种基于改进粒子群算法的数据特征选择方法，其特征是：对数据集进行随机划分，一部分作为训练样本，另一部分作为测试样本，进行分别测试，将得到的结果求平均，得到特征子集在分类器模型上得出的正确分类率。

4.如权利要求1所述的一种基于改进粒子群算法的数据特征选择方法，其特征是：利用自适应调整策略指导特征子集的选择，一开始依靠正确分类率高来指导特征选择，随着选择过程的继续，逐渐加入特征子集个数少这一指标来共同指导特征的选择。

5.如权利要求1所述的一种基于改进粒子群算法的数据特征选择方法，其特征是：确定数据集中特征选择标准为确定粒子种群的粒子位置范围，以各粒子的位置来决定相应的特征的选中和不选中。

6.如权利要求1所述的一种基于改进粒子群算法的数据特征选择方法，其特征是：利用改进的粒子群算法处理数据特征选择的过程包括：

(1)输入需要进行特征选择的数据集；

(2)初始化粒子种群的种群大小、最大迭代次数，并随机初始化粒子个体的初始位置和飞行速度；

(3)根据建立的特征子集质量评价函数，计算粒子群中每一个粒子的适应度值；

(4)初始化粒子群的个体最优位置pbest和全局最优位置gbest；

(5)采用Logistic混沌图谱更新粒子群算法的惯性权重，更新粒子群中每一个粒子的飞行速度；

(6)计算动态修正因子，采用组合位置更新粒子群中粒子的位置；

(7)计算粒子种群中每一个粒子的适应度值，并更新粒子群的个体最优位置pbest和全局最优位置gbest，得到更新问题的最优完整解；

(8)判断粒子群的进化是否到达算法设置的最大迭代次数，若是，停止进化，输出最优完整解作为数据集的最佳特征子集；否则，转入步骤(5)。

7.如权利要求6所述的一种基于改进粒子群算法的数据特征选择方法，其特征是：所述步骤(1)中，对需要进行特征选择的数据进行处理，将其用一个特征向量表示，具体是指将已获得的数据且已知标签的数据，用一条含有许多特征的向量进行表示，向量的每一维都表示该数据集中的一个特征。

8.如权利要求6所述的一种基于改进粒子群算法的数据特征选择方法，其特征是：所述步骤(7)中，对于粒子种群中的任何一个粒子，如果其适应度值优于历史最优位置的适应度值，则将当前粒子的位置作为新的个体最优位置，否则，保持粒子的历史个体最优位置不变；考虑种群的环形拓扑结构，将每个粒子的适应度值与其相邻若干个粒子的适应度值就行比较，并将适应度值较小的粒子作为当前粒子种群的全局最优位置。

9.如权利要求6所述的一种基于改进粒子群算法的数据特征选择方法，其特征是：所述步骤(7)中，比较粒子种群中所有粒子的适应度值，选出适应度值最小的一个粒子的位置，并与当前的最优完整解进行比较，如果其适应度值小于当前最优完整解的适应度值，则用该粒子位置去替换当前的完整解作为新的最优完整解；否则，最优完整解保持不变。

10.一种基于改进粒子群算法的数据特征选择系统，其特征是：运行于处理器或存储器上，被配置为执行以下指令：

确定评估特征子集的分类器模型；

以分类器模型的正确分类率指导特征选择，逐步加入特征子集个数共同指导特征的选择，建立特征子集的质量评价函数；

确定数据集中特征选择标准；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于山东大学，未经山东大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810844459.8/1.html，转载请声明来源钻瓜专利网。

上一篇：一种特征选择方法、装置及设备
下一篇：一种非结构化局部放电数据的模式识别方法及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于改进粒子群算法的数据特征选择方法及系统在审

专利文献下载