[发明专利]一种基于神经网络的非线性特征选择方法在审
申请号: | 202010331361.X | 申请日: | 2020-04-24 |
公开(公告)号: | CN111652271A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 朱建勇;杨辉;黄鑫;聂飞平 | 申请(专利权)人: | 华东交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京恒创益佳知识产权代理事务所(普通合伙) 11556 | 代理人: | 付金豹 |
地址: | 330013 江西省南昌市经*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 非线性 特征 选择 方法 | ||
1.一种基于神经网络的非线性特征选择方法,其特征在于,包括以下步骤:(1)神经网络嵌入:以神经网络误差函数代替稀疏正则化模型的线性误差函数,同时对神经网络输入层权值进行组稀疏约束,建立非线性特征选择模型;(2)鲁棒性优化:利用L2,1范数的鲁棒性,对神经网络进行鲁棒性优化,建立RSBP的目标函数;(3)优化策略:引入类L2,1范数的光滑函数,根据投影梯度下降法求解神经网络的迭代函数得到最优权值矩阵,取每个输入层神经元对应权值向量的绝对值之和作为特征重要性指标,解决所提出的问题。
2.根据权利要求1所述基于神经网络的非线性特征选择方法,其特征在于,所述步骤(1):
经典稀疏正则化模型(Lasso)可以理解为在满足L1范数约束条件下求线性回归问题的最优解β,其中y=(y1,…,yN)表示N维响应向量,输入量X为一个N×p矩阵,可以构造拉格朗日函数如下:
以神经网络误差函数代替稀疏正则化模型的线性误差函数,并根据神经网络权值的复杂性,对神经网络输入层权值进行组稀疏约束,得到非线性特征选择模型:
am=fm-1((Wm-1)Tam-1+bm-1) (3)
其中,E表示误差函数,h表示约束函数,w表示特征权值,f为激活函数,λ为稀疏系数,M为表示神经网络层数,am表示第m层净输出,bm表示第m层偏置值。
3.根据权利要求2所述基于神经网络的非线性特征选择方法,其特征在于,在设定神经网络参数的时候隐含层激活函数,采用ELU函数作为激活函数:
4.根据权利要求1所述基于神经网络的非线性特征选择方法,其特征在于,所述步骤(2):L2,1范数相较于L1范数具有更好的鲁棒性,在原始稀疏化神经网络的基础上加入鲁棒性约束:
5.根据权利要求1所述基于神经网络的非线性特征选择方法,其特征在于,所述步骤(3):由于L2,1范数为非光滑函数,需要设立一个类L2,1范数的光滑函数,然后根据投影梯度下降法求解神经网络的迭代函数,取每个输入层神经元对应权值向量的绝对值之和作为特征重要性指标,其过程为:
引入一个类L2,1范数:LR,1范数,该函数通过在不可微的点处加入平滑项使整个函数可微;LR,1范数如下所示:
表示极小值,当时,LR,1范数与L2,1范数等价,同时,由于加入了极小值确保函数的导数不为0,即整个定义域内可微;
假设神经网络层数为4层,ELU函数为激活函数,神经网络各层神经表示为l-i-j,同时用LR,1范数代替L2,1范数,带入得到以下结果;
对目标函数进行整体求导得到权值更新公式
计算各层神经元输出om:
然后根据误差反向计算各层偏导数:
令sm表示敏感性:
引入导数矩阵:
由此得到:
最后更新权值和偏置值
通过上述公式反复迭代更新优化直到满足停止条件,得到神经网络的最优输入层权值矩阵;最后,取每个输入层神经元对应权值向量的绝对值之和作为特征重要性指标,得到特征选择结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东交通大学,未经华东交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010331361.X/1.html,转载请声明来源钻瓜专利网。