[发明专利]一种基于人工蜂群算法的数据特征选择方法在审

专利信息
申请号: 201611162314.7 申请日: 2016-12-15
公开(公告)号: CN106650914A 公开(公告)日: 2017-05-10
发明(设计)人: 陈杰;周武能;陆康迪 申请(专利权)人: 东华大学
主分类号: G06N3/00 分类号: G06N3/00
代理公司: 上海泰能知识产权代理事务所31233 代理人: 宋缨,钱文斌
地址: 201620 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 人工 蜂群 算法 数据 特征 选择 方法
【权利要求书】:

1.一种基于人工蜂群算法的数据特征选择方法,其特征在于,包括以下步骤:

(1)确定人工蜂群算法的控制参数,将获得的数据集进行预约归一化处理;

(2)初始化产生一组采蜜蜂位置,依据选择的特征选择适应度函数计算每一个采蜜蜂的适应度值,并将其对应的开采次数置为零;

(3)基于人工蜂群算法的更新方式,更新采蜜蜂位置,计算新个体的适应度值并更新其开采次数;

(4)计算选择概率模型函数,依概率模型函数选择一个采蜜蜂作为观察蜂,更新观察蜂位置,计算新个体的适应度值并更新其开采次数;

(5)观察开采次数,实施采蜜蜂位置更新机制;

(6)保留目前为止最优解位置,即代表最优特征子集;

(7)若达到最大迭代次数,则输出最优特征子集;否则重复步骤(2)~步骤(6)。

2.根据权利要求1所述的基于人工蜂群算法的数据特征选择方法,其特征在于,所述步骤(1)的具体为:对数据集中的每一维特征值映射至[0,1]范围,即f'=(f-fmin)/(fmax-fmin),其中,f'为该维特征映射后的值,f为该维特征未映射前的值,f min为该维特征在数据集中的最小值,fmax为该维特征在数据集中的最大值。

3.根据权利要求1所述的基于人工蜂群算法的数据特征选择方法,其特征在于,所述步骤(2)中初始化产生一组采蜜蜂位置具体为:针对特征选择这一组合优化问题,对采蜜蜂位置采用二进制编码,编码长度值代表数据集中原始特征的总个数,用“1”表示该位代表的特征被选中,用“0”表示该位代表的特征未被选中。

4.根据权利要求3所述的基于人工蜂群算法的数据特征选择方法,其特征在于,所述步骤(2)中每一个采蜜蜂的适应度值计算方式为Fit=w*(1-Acc)+(1-w)*(N1/N2),其中,Fit为适应度函数值,Acc为基于数据集利用10-fold交叉验证法计算得到的学习算法的准确率,N1为采蜜蜂位置中置为“1”的个数,N2为数据集中原始特征的总个数;w为权重值,取值范围为[0,1]。

5.根据权利要求1所述的基于人工蜂群算法的数据特征选择方法,其特征在于,所述步骤(3)中基于人工蜂群算法的更新方式为其中,R为0~1的随机数,xij代表第i个采蜜蜂第j个位置的值,vij为xij更新后的值,NOT代表取反逻辑操作。

6.根据权利要求1所述的基于人工蜂群算法的数据特征选择方法,其特征在于,所述的步骤(4)中概率模型函数为其中,Fiti为第i个采蜜蜂的适应度值,pi为第i个采蜜蜂被选中的概率。

7.根据权利要求1所述的基于人工蜂群算法的数据特征选择方法,其特征在于,所述的步骤(5)具体为:观察采蜜蜂对应的开采次数,如果开采次数大于或等于最大开采次数,则将此采蜜蜂的位置替换为一个重新随机初始化的位置。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611162314.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top