[发明专利]一种基于人工蜂群算法的数据特征选择方法在审
申请号: | 201611162314.7 | 申请日: | 2016-12-15 |
公开(公告)号: | CN106650914A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 陈杰;周武能;陆康迪 | 申请(专利权)人: | 东华大学 |
主分类号: | G06N3/00 | 分类号: | G06N3/00 |
代理公司: | 上海泰能知识产权代理事务所31233 | 代理人: | 宋缨,钱文斌 |
地址: | 201620 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工 蜂群 算法 数据 特征 选择 方法 | ||
1.一种基于人工蜂群算法的数据特征选择方法,其特征在于,包括以下步骤:
(1)确定人工蜂群算法的控制参数,将获得的数据集进行预约归一化处理;
(2)初始化产生一组采蜜蜂位置,依据选择的特征选择适应度函数计算每一个采蜜蜂的适应度值,并将其对应的开采次数置为零;
(3)基于人工蜂群算法的更新方式,更新采蜜蜂位置,计算新个体的适应度值并更新其开采次数;
(4)计算选择概率模型函数,依概率模型函数选择一个采蜜蜂作为观察蜂,更新观察蜂位置,计算新个体的适应度值并更新其开采次数;
(5)观察开采次数,实施采蜜蜂位置更新机制;
(6)保留目前为止最优解位置,即代表最优特征子集;
(7)若达到最大迭代次数,则输出最优特征子集;否则重复步骤(2)~步骤(6)。
2.根据权利要求1所述的基于人工蜂群算法的数据特征选择方法,其特征在于,所述步骤(1)的具体为:对数据集中的每一维特征值映射至[0,1]范围,即f'=(f-fmin)/(fmax-fmin),其中,f'为该维特征映射后的值,f为该维特征未映射前的值,f min为该维特征在数据集中的最小值,fmax为该维特征在数据集中的最大值。
3.根据权利要求1所述的基于人工蜂群算法的数据特征选择方法,其特征在于,所述步骤(2)中初始化产生一组采蜜蜂位置具体为:针对特征选择这一组合优化问题,对采蜜蜂位置采用二进制编码,编码长度值代表数据集中原始特征的总个数,用“1”表示该位代表的特征被选中,用“0”表示该位代表的特征未被选中。
4.根据权利要求3所述的基于人工蜂群算法的数据特征选择方法,其特征在于,所述步骤(2)中每一个采蜜蜂的适应度值计算方式为Fit=w*(1-Acc)+(1-w)*(N1/N2),其中,Fit为适应度函数值,Acc为基于数据集利用10-fold交叉验证法计算得到的学习算法的准确率,N1为采蜜蜂位置中置为“1”的个数,N2为数据集中原始特征的总个数;w为权重值,取值范围为[0,1]。
5.根据权利要求1所述的基于人工蜂群算法的数据特征选择方法,其特征在于,所述步骤(3)中基于人工蜂群算法的更新方式为其中,R为0~1的随机数,xij代表第i个采蜜蜂第j个位置的值,vij为xij更新后的值,NOT代表取反逻辑操作。
6.根据权利要求1所述的基于人工蜂群算法的数据特征选择方法,其特征在于,所述的步骤(4)中概率模型函数为其中,Fiti为第i个采蜜蜂的适应度值,pi为第i个采蜜蜂被选中的概率。
7.根据权利要求1所述的基于人工蜂群算法的数据特征选择方法,其特征在于,所述的步骤(5)具体为:观察采蜜蜂对应的开采次数,如果开采次数大于或等于最大开采次数,则将此采蜜蜂的位置替换为一个重新随机初始化的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611162314.7/1.html,转载请声明来源钻瓜专利网。