[发明专利]基于GBDT算法的攻击识别方法及光伏并网接口装置在审

申请号：	201911342894.1	申请日：	2019-12-23
公开（公告）号：	CN111144472A	公开（公告）日：	2020-05-12
发明（设计）人：	吴海涛;徐成斌;贺生国;代尚林;陈锐;乔中伟;李伟华;梁洪浩;陈远生;占捷文;王乾刚;朱小帆;丁凯;黄植炜;肖声远;何鸿雁;习伟;匡晓云;于杨;姚浩;简淦杨;杨祎巍	申请（专利权）人：	深圳供电局有限公司;长园深瑞继保自动化有限公司;南方电网科学研究院有限责任公司
主分类号：	G06K9/62	分类号：	G06K9/62;H02J3/38
代理公司：	深圳市中知专利商标代理有限公司 44101	代理人：	孙皓;顾楠楠
地址：	518000 广东省深圳市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 gbdt 算法攻击识别方法并网接口装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于GBDT算法的攻击识别方法，其特征在于：包括如下步骤：

步骤一、获取光伏并网接口装置的信息数据流；

步骤二、对信息数据流进行预处理；

步骤三、将进行预处理后的信息数据流采用GBDT模型进行分类，输出分类结果，所述分类包括正常类以及恶意攻击类；

步骤四、当分类结果中存在攻击类时，则根据攻击类中数据的归类发出相应的报警提示以及生成日志记录进行保存同时还对信息数据流进行拦截；当分类结果均为正常类时，则对信息数据流进行转发。

2.根据权利要求1所述的基于GBDT算法的攻击识别方法，其特征在于：所述步骤四还包括将分类结果、报警提示和/或日志记录发送至上层。

3.根据权利要求1所述的基于GBDT算法的攻击识别方法，其特征在于：所述预处理包括特征提取、数值化以及归一化处理。

4.根据权利要求1所述的基于GBDT算法的攻击识别方法，其特征在于：所述步骤三将进行预处理后的信息数据流采用GBDT模型进行检测前，先对GBDT模型进行分类训练，得到已训练好的GBDT分类模型，模型训练包括如下步骤：

一、建立样本集，所述样本集包括正样本以及负样本，所以正样本为正常的信息数据流，负样本为受到恶意攻击的信息数据流，所述恶意攻击包括Dos攻击，未授权访问攻击、接口端非正常探测、木马病毒攻击，运行状态、气象等消息伪造或篡改等攻击类型的数据流；

二、输入给定的训练集T＝{(x₁,y₁)，(x₂,y₂)，…，(x_n,y_n)}；迭代次数M；一个可微的损失函数y_k＝{0，1}，表示样本x是否属于第k类，1代表是，0代表否；p_k(x)表示样本x属于第k类的概率；x_i(i＝1，2，…，n)为输入样本，y_i(i＝1，2，…，n)为输入样本x_i对应的输出值，也即分类标签(表明该样本是正常或何种攻击类型的标签)；f_k(x)为弱学习器，k＝1,2,...,K，K表示共有分类的类别的总数：正常类，Dos攻击，未授权访问攻击，接口端非正常探测，木马病毒攻击，消息篡改攻击；

(1)根据样本集(含正负样本)中设定的标签值y_i，对弱学习器模型进行初始化：f_k(x)＝0，k＝1,2,...,K(K为分类数，K＝6)；

(2)设置迭代次数m＝1,2，…，M：

(2.1)计算样本点属于每个类别的概率：

其中，exp(f_k(x))表示对f_k(x)求指数；K为分类数目；

(2.2)对于每一个分类类型k＝1,2,...,K：

(2.2.1)计算残差：

r_ki＝y_ki-P_k(x_i)，

其中，i＝1，2，…，n为样本数；y_ki为第i个样本对应的第k类取值；P_k(x_i)为样本x_i属于k类的概率；

(2.2.2)以概率伪残差{(x₁,r_k1)，……，(x_n,r_kn)}重新训练拟合一个分类树；

(2.2.3)计算乘子：

其中，K为类别数；c_mkj为m次迭代、第k类生成的树的叶子节点乘子；R_mkj为m次迭代、第k类生成的树的叶子节点区域；j＝1,2，…，J为叶子节点数；m＝1,2，…，M为迭代次数；x_i(i＝1，2，…，n)为输入样本；r_ki为第i个样本第k类伪残差；

(2.2.4)通过以下计算公式更新学习器：

其中，f_k,m(x)为样本x的m次迭代、第k类得到的学习器；f_k,m-1(x)为样本x的m-1次迭代、第k类得到的学习器；I为叶子特征的集合；R_mkj为m次迭代、第k类生成的树的叶子节点区域，j＝1,2，…，J为叶子节点数；

(3)输出强分类器F_Mk(x)：

其中，F_Mk(x)为样本x的M次迭代、第k类得到的强分类器；c_mkj为m次迭代、第k类生成的树的叶子节点乘子；R_mkj为m次迭代、第k类生成的树的叶子节点区域，j＝1,2，…，J为叶子节点数；m＝1,2，…，M为迭代次数；I为叶子特征的集合；

最后得到的F_Mk(x)用来得到第k类的相应的概率P_Mk(x)：

将概率转换为类别：

其中为最终的输出类别，c(k,k')表示当真实值为k'时，预测为第k类时的联合代价，即概率最大的类别即为预测的类别，最终得到已训练好的GBDT模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳供电局有限公司;长园深瑞继保自动化有限公司;南方电网科学研究院有限责任公司，未经深圳供电局有限公司;长园深瑞继保自动化有限公司;南方电网科学研究院有限责任公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911342894.1/1.html，转载请声明来源钻瓜专利网。

上一篇：一种高能量密度锂离子电池负极材料及其制备方法
下一篇：一种基于HBase的3D Tiles数据的存取方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于GBDT算法的攻击识别方法及光伏并网接口装置在审

专利文献下载