[发明专利]基于改进的BBA算法的电离层高维数据特征选择方法有效
申请号: | 202110390672.8 | 申请日: | 2021-04-12 |
公开(公告)号: | CN113076695B | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 梁会军;钟建伟;杨永超;秦勉 | 申请(专利权)人: | 湖北民族大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06K9/62;G06N3/00;G06F111/06 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 闫伟姣 |
地址: | 445000 湖北省恩*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 bba 算法 电离 层高 数据 特征 选择 方法 | ||
本发明公开一种基于改进的BBA算法的电离层高维数据特征选择方法,包括:获取电离层数据;以维度分类损失函数为目标函数;采用改进的BBA算法求解目标函数,所述改进的BBA算法包括对个体速度在单个维度上进行更新后,根据时变V型转换函数将更新后的个体速度进行连续空间至离散空间的映射;求解后确定目标维度,根据目标维度对电离层数据进行降维处理后,得到目标维度对应的电离层特征。引入随机黑洞模型,提出时变V型转换函数,以对BBA算法进行改进,基于改进后的离散二进制蝙蝠算法对电离层高维数据降维后,生成最小化的特征子集,降低数据误差率,提高维度分类精度,选择较为准确的电离层数据特征。
技术领域
本发明涉及高维数据特征选择技术领域,特别是涉及一种基于改进的BBA算法的电离层高维数据特征选择方法。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
数据挖掘是信息技术快速发展而衍生出的一个分支,它要求从海量数据中通过算法分析、提取隐藏于数据中的有用信息,一般包含如下处理过程:①数据准备,②数据挖掘,③结果表达与解释。这其中有一个重要的预处理步骤,即特征选择,它的主要作用是减少特定数据中不相关的或冗余的属性。
目前常用的特征选择方法大致可以分为过滤(filter)法、包裹(wrapper)法以及这两种方法的混杂(hybrid)方法。过滤法不借助学习算法,直接依赖真实数据集特征,给每一维特征赋予权重,每个权重代表了该特征的重要性,然后依据重要性进行排序,进而选择需要的特征信息。包裹法则借助于学习算法,通过选择出的特征相对应的分类准确性,来辨别特征选择的好坏;该方法计算复杂度高,可以借助优化算法来解决。混杂方法是将以上两种方法相结合。研究表明,一般来说,包裹法可以取得比过滤法更好的特征选择结果。
近年来,元启发式算法在机器学习、数据挖掘、工程设计以及特征选择等问题上显示出了杰出的能力,特别是在特征选择问题研究上,它们并不需要搜索整个数据空间,却能得到令人满意的特征选择结果;而一般的精确搜索方法虽然能保证找到准确的特征子集,但是消耗时间巨大,并且受计算机存储的限制,特别是对高维复杂系统,该方法显得效率低下甚至无能为力。在特征选择问题中,如果一个数据集有n个特征,那么则对应有2^n种特征选择方法,因此,特征选择复杂度呈指数级增长。元启发式方法虽然不能保证找到准确的最优特征子集,却能生成与之非常接近的特征子集,并且不受研究问题维度的限制,因此,在特征选择方法上得到了广泛研究,具有代表性的有离散二进制粒子群优化算法(BPSO)、离散二进制灰狼算法(BGWO)、及遗传算法(GA)以及离散二进制蝙蝠算法(BBA)等。
虽然元启发式方法在特征选择方面获得了成功,但是这种方法也有诸多局限性,比如算法的探索(exploration)和开拓(exploitation)能力不足,以及遭受早熟收敛等问题。例如,对二进制粒子群优化算法来说,粒子的权重系数为一常数,这限制了算法的全局搜索能力,从而使得算法容易出现早熟收敛。再如遗传算法,个体初始值对最终优化结果的影响较大,通常需要混杂其他方法来提升性能。
对于现有的离散二进制蝙蝠算法,该算法仅仅实现了将个体速度从连续空间映射到二进制离散空间,对于算法的探索和开拓能力则没有任何实质性的改变,对与算法收敛相关的参数也没有进行处理。因此,如何最大限度的提高高维数据特征选择的准确率,同时提升优化算法的性能和收敛速度,是本领域技术人员目前需要迫切解决的技术难题。
对于不方便使用数学方法建模但能使用高维数据进行特征描述的对象,即能使用具体数据进行描述的对象,如申报文档仿真使用的电离层数据,通过34个维度展现电离层的特征。当前针对该类对象存在的问题在于:通常描述该类电离层对象的特征较多,即维度高,特征选择的挑战在于:在高维度数据的条件下,如何生成一个最小化的特征子集,同时对分类精度没有影响或者将影响降到最低;现有算法降维后通常得到的维度相对较多,意味着维度依然存在减小的空间;此外,针对该类电离层对象,现有算法得到的降维后的数据误差率较高,而误差率较高的原因在于现有算法对维度的选择不够准确。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北民族大学,未经湖北民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110390672.8/2.html,转载请声明来源钻瓜专利网。