[发明专利]一种特征选择方法、装置、存储介质和设备在审
申请号: | 202111210992.7 | 申请日: | 2021-10-18 |
公开(公告)号: | CN113869332A | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 王红凯;冯珺;潘司晨;江樱;琚小明;黄海潮;张烨华;彭梁英;赵帅;应张驰;王嘉琦;张澄心 | 申请(专利权)人: | 国网浙江省电力有限公司信息通信分公司;浙江捷瑞电力科技有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/00;G06N20/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李慧慧 |
地址: | 310063 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 选择 方法 装置 存储 介质 设备 | ||
1.一种特征选择方法,其特征在于,包括:
预先获取经由对原始数据进行特征工程所得到的各个特征;
利用ReliefF算法,计算各个所述特征的权重;
删除权重小于预设权重阈值的特征,并将剩余的特征标识为有效特征;
调用预设的适应度函数,对基于各个所述有效特征初始化得到的粒子群中的每个粒子进行适应度评估,并通过预设粒子群算法,迭代更新每个所述粒子的位置和速度,得到每个所述粒子的最终适应度;其中,所述适应度函数的参数项包括特征子集在预设分类器上的分类效果、所述特征子集的重要性、所述特征子集所包含的有效特征的数量;所述特征子集的重要性,基于所述特征子集中所包含的有效特征的权重所确定;每个所述粒子均代表一个所述特征子集;所述特征子集包括多个所述有效特征;
选取最终适应度最小的特征子集中所包含的有效特征,作为所述机器学习模型的训练特征。
2.根据权利要求1所述的方法,其特征在于,所述利用ReliefF算法,计算各个所述特征的权重,包括:
基于各个所述特征,构建特征集;
依据抽样步骤对所述特征集进行多次抽样;其中,所述抽取步骤包括:从所述特征集中随机选择一个样本,并从和所述样本同类的其它样本中选取多个最近邻样本,作为第一最近邻样本,以及从和所述样本不同的每一类的其它样本中选取多个最近邻样本,作为第二最近邻样本;
将所述样本、所述第一最近邻样本和所述第二最近邻样本,代入预设的迭代计算公式中,计算得到每个所述特征的权重。
3.根据权利要求1所述的方法,其特征在于,所述调用预设的适应度函数,对基于各个所述有效特征初始化得到的粒子群中的每个粒子进行适应度评估,并通过预设粒子群算法,迭代更新每个所述粒子的位置和速度,得到每个所述粒子的最终适应度,包括:
从各个所述有效特征中,随机选取两个所述有效特征组合为特征子集;
计算每个所述特征子集的互信息,并将每个所述特征子集的互信息均转换为互信息矩阵;
基于各个所述互信息矩阵、预先设定的粒子数和每个粒子的特征数,构建粒子群;
按照预设步骤对所述粒子群进行多次迭代更新,得到每个所述粒子的最终适应度;其中,所述预设步骤包括:利用预设的适应度函数,对所述粒子群中的每个所述粒子进行适应度评估,得到每个所述粒子的适应度;依据适应度最小的粒子的速度,对每个所述粒子的速度进行更新;依据适应度最小的粒子的位置,对每个所述粒子的位置进行更新。
4.根据权利要求1所述的方法,其特征在于,所述特征子集的重要性,基于所述特征子集中所包含的有效特征的权重所确定,包括:
对于所述特征子集中的每个有效特征,依据所述有效特征的权重,确定所述有效特征的重要性值;
计算各个所述有效特征的重要性值的平均值,得到所述特征子集的重要性。
5.一种面向边缘端机器学习模型的特征选择装置,其特征在于,包括:
特征获取单元,用于预先获取经由对原始数据进行特征工程所得到的各个特征;
权重计算单元,用于利用ReliefF算法,计算各个所述特征的权重;
特征删除单元,用于删除权重小于预设权重阈值的特征,并将剩余的特征标识为有效特征;
粒子群优化单元,用于调用预设的适应度函数,对基于各个所述有效特征初始化得到的粒子群中的每个粒子进行适应度评估,并通过预设粒子群算法,迭代更新每个所述粒子的位置和速度,得到每个所述粒子的最终适应度;其中,所述适应度函数的参数项包括特征子集在预设分类器上的分类效果、所述特征子集的重要性、所述特征子集所包含的有效特征的数量;所述特征子集的重要性,基于所述特征子集中所包含的有效特征的权重所确定;每个所述粒子均代表一个所述特征子集;所述特征子集包括多个所述有效特征;
特征选取单元,用于选取最终适应度最小的特征子集中所包含的有效特征,作为所述机器学习模型的训练特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司信息通信分公司;浙江捷瑞电力科技有限公司,未经国网浙江省电力有限公司信息通信分公司;浙江捷瑞电力科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111210992.7/1.html,转载请声明来源钻瓜专利网。