[发明专利]一种基于机器学习的光纤入侵检测方法在审
申请号: | 202111460428.0 | 申请日: | 2021-12-01 |
公开(公告)号: | CN114118163A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 蒋俊正;陈俊杰;刘志强 | 申请(专利权)人: | 桂林电子科技大学;中国电子科技集团公司第三十四研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N20/10;G08B13/12 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 罗玉荣 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 光纤 入侵 检测 方法 | ||
1.一种基于机器学习的光纤入侵检测方法,其特征在于,包括如下步骤:
1)信号预处理:假设光纤检测信号为共n×m个数据,其中表示第i组光纤检测信号,检测时长为m时刻,检测信号对应的标签是one-hot编码矩阵,xi由公式(1)表达为:
在公式(1)中,表示原始信号,ε表示噪声,对xi进行去噪处理,首先对信号xi进行小波分解,得到小波系数,分解公式如公式(2)所示:
在公式(2)中,j=0,1,2,...,J,其中J表示最佳分解尺度,u(j,k)表示尺度函数对应的低通滤波器,v(j,k)表示小波函数Ψ(t)所对应的高通滤波器,Hs(j,k)表示尺度系数,其中Hs(0,k)=xi,Ws(j,k)表示小波系数,并且ωi=[Ws(1,k),Ws(2,k),...,Ws(J+1,k)]表示分解得到的小波系数,然后选取阈值对小波系数进行修正,阈值选取函数分为硬阈值和软阈值函数两种,选择软阈值函数,表达式如公式(3)所示:
在公式(3)中,sgn(·)表示符号函数,λ表示估计的阈值,表示阈值处理后的小波系数,最后进行信号重构得到去噪后的信号如公式(4)所示:
在公式(4)中,和分别表示u(j,k)和v(j,k)的共轭,最后得到即为去除噪声后的信号
2)信号特征提取:对步骤1)得到去噪后的信号进行特征提取,具体的做法是对进行离散傅里叶变换,将去噪后的信号从时域转化到频域,如公式(5)所示:
在公式(5)中,表示第i组光纤检测信号在第j个时刻所采集的数据;
3)分类模型:融合模型将多层感知器MLP、支持向量机SVM和LightGBM进行融合对光纤检测数据进行处理,融合模型以MLP作为主要模型,SVM和LightGBM作为辅助模型,MLP由输入层、输出层和隐藏层组成、每一层之间的前向传播公式如公式(6)所示:
其中,表示第k层的权值矩阵,I和O分别表示第k层的输入维度和输出维度,其中表示第k层的偏置矩阵,其中表示第k层的偏置,XK表示第k层的输出,其中X0=[xf1,xf2,...,xfn]T,f(·)表示激活函数,最终得到的表示MLP对光纤检测数据分类后的概率矩阵,其中和分别表示对第i组光纤检测数据分类为正常和入侵的概率,并且当时认为第i组光纤检测数据为入侵数据;当时认为第i组光纤检测数据为正常数据,其中thr1和thr2均表示阈值,且thr1>thr2;当时,采用SVM和LightGBM综合判断,SVM为二元分类器将数据的特征映射为高维空间上的点,再采用超平面将数据分为两个不同的类,SVM将超平面间隔最大化,假设超平面H为将不同样本分割开的超平面,则由公式(7)表示为:
ωTx+b=0 (7),
其中ω=(ω1,ω2,...,ωd),令H1和H2是离超平面H最近的样本点所处的平面,那么支持向量就是距离H最近的点,其中H1和H2表示为ωTx+b=1和ωTx+b=-1,任意一个样本点xi(i=1,2,...,N)到H的距离由公式(8)表示为:
公式(9)表示超平面与所有样本点的最小距离dm,因此SVM模型求解最大分割超平面问题由公式(10)的最优化问题表示:
求解得到超平面H,最终通过该超平面将样本分类为两类,并与MLP类似,计算得到分类概率psvm,LightGBM为基于梯度提升决策树GBDT的模型,LightGBM则采用直方图算法搜寻最优分割点,直方图算法的步骤如下:
3-1)将连续的特征值离散化为k个整数,同时将特征值构造为一个宽度为k的直方图,将直方图中存储样本的梯度之和及特征值的样本数量存储至各自的分桶中;
3-2)循环遍历所有特征值并重复步骤3-1);
3-3)遍历所有的分桶,并以当前分桶为分割点计算当前分桶的增益值,增益值计算如公式(11)所示:
其中,SL、SR和SP分别表示当前分桶与左侧分桶的梯度和、当前分桶与右侧分桶的梯度和以及父节点的总梯度之和,nL、nR和nP分别表示当前分桶的左侧样本数量、当前分桶的右侧样本数量以及当总样本数量;
3-4)选取最大增益,将最大增益的特征和分桶统计值作为当前分裂的准则,得到分类结果后,计算当前样本的分类概率pL,当时,由公式(12)计算融合模型结果:
其中a、b和c分别表示MLP、SVM和LightGBM所占的权重,并且a+b+c=1,当p>thr3时,则认为该样本为入侵数据,反之为正常数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学;中国电子科技集团公司第三十四研究所,未经桂林电子科技大学;中国电子科技集团公司第三十四研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111460428.0/1.html,转载请声明来源钻瓜专利网。