[发明专利]基于GBDT算法的攻击识别方法及光伏并网接口装置在审
申请号: | 201911342894.1 | 申请日: | 2019-12-23 |
公开(公告)号: | CN111144472A | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 吴海涛;徐成斌;贺生国;代尚林;陈锐;乔中伟;李伟华;梁洪浩;陈远生;占捷文;王乾刚;朱小帆;丁凯;黄植炜;肖声远;何鸿雁;习伟;匡晓云;于杨;姚浩;简淦杨;杨祎巍 | 申请(专利权)人: | 深圳供电局有限公司;长园深瑞继保自动化有限公司;南方电网科学研究院有限责任公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;H02J3/38 |
代理公司: | 深圳市中知专利商标代理有限公司 44101 | 代理人: | 孙皓;顾楠楠 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 gbdt 算法 攻击 识别 方法 并网 接口 装置 | ||
1.一种基于GBDT算法的攻击识别方法,其特征在于:包括如下步骤:
步骤一、获取光伏并网接口装置的信息数据流;
步骤二、对信息数据流进行预处理;
步骤三、将进行预处理后的信息数据流采用GBDT模型进行分类,输出分类结果,所述分类包括正常类以及恶意攻击类;
步骤四、当分类结果中存在攻击类时,则根据攻击类中数据的归类发出相应的报警提示以及生成日志记录进行保存同时还对信息数据流进行拦截;当分类结果均为正常类时,则对信息数据流进行转发。
2.根据权利要求1所述的基于GBDT算法的攻击识别方法,其特征在于:所述步骤四还包括将分类结果、报警提示和/或日志记录发送至上层。
3.根据权利要求1所述的基于GBDT算法的攻击识别方法,其特征在于:所述预处理包括特征提取、数值化以及归一化处理。
4.根据权利要求1所述的基于GBDT算法的攻击识别方法,其特征在于:所述步骤三将进行预处理后的信息数据流采用GBDT模型进行检测前,先对GBDT模型进行分类训练,得到已训练好的GBDT分类模型,模型训练包括如下步骤:
一、建立样本集,所述样本集包括正样本以及负样本,所以正样本为正常的信息数据流,负样本为受到恶意攻击的信息数据流,所述恶意攻击包括Dos攻击,未授权访问攻击、接口端非正常探测、木马病毒攻击,运行状态、气象等消息伪造或篡改等攻击类型的数据流;
二、输入给定的训练集T={(x1,y1),(x2,y2),…,(xn,yn)};迭代次数M;一个可微的损失函数yk={0,1},表示样本x是否属于第k类,1代表是,0代表否;pk(x)表示样本x属于第k类的概率;xi(i=1,2,…,n)为输入样本,yi(i=1,2,…,n)为输入样本xi对应的输出值,也即分类标签(表明该样本是正常或何种攻击类型的标签);fk(x)为弱学习器,k=1,2,...,K,K表示共有分类的类别的总数:正常类,Dos攻击,未授权访问攻击,接口端非正常探测,木马病毒攻击,消息篡改攻击;
(1)根据样本集(含正负样本)中设定的标签值yi,对弱学习器模型进行初始化:fk(x)=0,k=1,2,...,K(K为分类数,K=6);
(2)设置迭代次数m=1,2,…,M:
(2.1)计算样本点属于每个类别的概率:
其中,exp(fk(x))表示对fk(x)求指数;K为分类数目;
(2.2)对于每一个分类类型k=1,2,...,K:
(2.2.1)计算残差:
rki=yki-Pk(xi),
其中,i=1,2,…,n为样本数;yki为第i个样本对应的第k类取值;Pk(xi)为样本xi属于k类的概率;
(2.2.2)以概率伪残差{(x1,rk1),……,(xn,rkn)}重新训练拟合一个分类树;
(2.2.3)计算乘子:
其中,K为类别数;cmkj为m次迭代、第k类生成的树的叶子节点乘子;Rmkj为m次迭代、第k类生成的树的叶子节点区域;j=1,2,…,J为叶子节点数;m=1,2,…,M为迭代次数;xi(i=1,2,…,n)为输入样本;rki为第i个样本第k类伪残差;
(2.2.4)通过以下计算公式更新学习器:
其中,fk,m(x)为样本x的m次迭代、第k类得到的学习器;fk,m-1(x)为样本x的m-1次迭代、第k类得到的学习器;I为叶子特征的集合;Rmkj为m次迭代、第k类生成的树的叶子节点区域,j=1,2,…,J为叶子节点数;
(3)输出强分类器FMk(x):
其中,FMk(x)为样本x的M次迭代、第k类得到的强分类器;cmkj为m次迭代、第k类生成的树的叶子节点乘子;Rmkj为m次迭代、第k类生成的树的叶子节点区域,j=1,2,…,J为叶子节点数;m=1,2,…,M为迭代次数;I为叶子特征的集合;
最后得到的FMk(x)用来得到第k类的相应的概率PMk(x):
将概率转换为类别:
其中为最终的输出类别,c(k,k')表示当真实值为k'时,预测为第k类时的联合代价,即概率最大的类别即为预测的类别,最终得到已训练好的GBDT模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳供电局有限公司;长园深瑞继保自动化有限公司;南方电网科学研究院有限责任公司,未经深圳供电局有限公司;长园深瑞继保自动化有限公司;南方电网科学研究院有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911342894.1/1.html,转载请声明来源钻瓜专利网。