[发明专利]一种基于二进制蜜蜂觅食算法的特征选择方法在审
申请号: | 202111138676.3 | 申请日: | 2021-09-27 |
公开(公告)号: | CN113869481A | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 张志成;孙雪瑶 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06N3/00 | 分类号: | G06N3/00;G06K9/62 |
代理公司: | 北京市浩东律师事务所 11499 | 代理人: | 孙莉 |
地址: | 100089 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 二进制 蜜蜂 觅食 算法 特征 选择 方法 | ||
本发明公开了一种基于二进制蜜蜂觅食算法的特征选择方法,涉及数据挖掘技术领域。针对现有的对高维数据进行特征选择的需求,该方法将蜜蜂种群分为侦察蜂、采蜜蜂和待工蜂,不同的子种群采用不同的策略进行更新,并将搜索空间限制在[0,1]之间。其中,侦察蜂采用随机搜索的方式,采蜜蜂采用V形传递函数进行二进制位置更新,待工蜂位置更新采用单一维度位置取反的策略。该方法具有特征选择准确性高,鲁棒性强,搜索效率高等特点,实现了对高维数据集进行特征选择的高效求解。
技术领域
本发明涉及数据挖掘技术领域,具体为一种基于二进制蜜蜂觅食算法的特征选择方法。
背景技术
现有技术中,蜜蜂觅食算法是近年来新提出的连续优化算法,该算法是一种有效的求解包裹式特征选择问题的方法,算法将蜜蜂种群分为侦察蜂、采蜜蜂和待工蜂,利用侦察蜂进行全局搜索,利用采蜜蜂的全维度搜索来对食物源位置进行更新,利用待工蜂的随机单维度搜索让食物源位置更新更加高效。蜜蜂觅食算法效率高,需要调节的参数少,具有很强的搜索能力,这些性质说明该算法可以应用于解决特征选择问题。
现有的蜜蜂觅食算法其实并不是专门用来处理特征选择任务,而是为了处理连续优化问题,因此将蜜蜂觅食算法直接用于解决特征选择问题时存在一些缺点,比如分类精度低、选取的特征数目偏大、鲁棒性较差、搜索速度较慢等问题,这大大影响了蜜蜂觅食算法在对高维数据进行特征选择时的实际应用效果。
发明内容
针对现有技术的不足,本发明提供了一种基于二进制蜜蜂觅食算法的特征选择方法,解决了上述背景技术中提出的原始的蜜蜂觅食算法直接用来解决特征选择问题时存在的一些缺点,比如分类精度低、选取的特征数目偏大、鲁棒性较差、搜索速度较慢等问题。
为实现以上目的,本发明通过以下技术方案予以实现:一种基于二进制蜜蜂觅食算法的特征选择方法,包括下述操作步骤:
S1、从公共数据集中提取特征数据;
S2、进行参数初始化,设置最大迭代次数Max_iteration,独立运行次数runtime,种群规模pop,整个蜂群包含侦察蜂、采蜜蜂和待工蜂;
S3、N个侦察蜂随机搜索空间,其搜索空间被限制在[0,1]之间,其位置如式:
其中,Ps是侦察蜂的位置,rand是大小在[0,1]之间的随机数,如果这个随机数小于0.5,则侦察蜂的位置取0,反之取1。
S4、计算适应度函数值,根据适应度函数值对食物源进行排序,选择适应度函数值较小的0.5N个食物源作为选定食物源,适应度函数的计算过程如式所示:
其中,γRD是通过将错误分类的实例数除以实例总数得出的分类错误率。R是所选特征子集的长度,M是特征的总数,参数α与β是权系数,其中β=1-α,将α设置为0.99,β设置为0.01。
S5、根据以下公式设置停滞上限:
其中Limitst表示食物源停滞的上限,如果停滞数大于Limitst,则相应的选定食物源将被抛弃,nsc是邻域收缩系数,被设为0.8。
S6、进行采蜜蜂局部搜索阶段,采蜜蜂更新食物源的步骤如下:
(6-1)、根据下式给每个选定食物源平均分配采蜜蜂:
其中Ni是第i个选定食物源招募的采蜜蜂数量,nf表示采蜜蜂总数,ns表示选定食物源的数目;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111138676.3/2.html,转载请声明来源钻瓜专利网。