[发明专利]一种基于PCA和随机森林分类的入侵检测方法有效
申请号: | 201710590718.4 | 申请日: | 2017-07-19 |
公开(公告)号: | CN107395590B | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | 陈明志;林伟宁;杨小权;郑绍华;刘川葆;李光耀;康年华;林诗洁 | 申请(专利权)人: | 福州大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于PCA和随机森林分类的入侵检测方法,其实现步骤为:(1)从入侵检测数据集中选取训练样本集和测试样本集;(2)通过PCA算法对训练样本集X进行特征降维处理,得到新的低维样本集合X’;(3)对于新的低维样本集合X’,通过给定随机森林中决策树的数量t,从低维样本集合X’中有放回地抽取N个子集,每颗决策树都对N个子集进行训练,最终得到一个随机森林分类器;(4)将测试样本集输入随机森林分类器,得到测试样本集的最终入侵检测结果。本发明使用先降维后分类的思想,对数据先进行特征降维然后再进行分类,与普通的基于机器学习入侵检测技术相比,本发明提出的入侵检测方法可有效提高检测的准确性。 | ||
搜索关键词: | 一种 基于 pca 随机 森林 分类 入侵 检测 方法 | ||
【主权项】:
1.一种基于PCA和随机森林分类的入侵检测方法,其特征在于,包括如下步骤:步骤1:从入侵检测数据集中选取训练样本集和测试样本集;步骤2:通过PCA算法对训练样本集X进行特征降维处理,得到新的低维样本集合X’;步骤3:对于新的低维样本集合X’,通过给定随机森林中决策树的数量t,从低维样本集合X’中有放回地抽取N个子集,每颗决策树都对N个子集进行训练,最终得到一个随机森林分类器;步骤4:将测试样本集输入随机森林分类器,得到测试样本集的最终入侵检测结果;所述步骤2的具体过程如下:(1)对训练样本集X={xi,x2,…,xn}中所有样本进行中心化:
(2)计算样本的协方差矩阵:
(3)取前K个最大的特征值并计算对应的特征向量W=(W1,W2…,Wk),以W为一组基构造新的低维样本集合X’,其中,10≤K≤20;所述步骤3的具体过程如下:(1)给定决策树数量t≥20,对随机森林中的每一颗决策树,从低维样本集合X’中随机抽取部分数据集Z={(z1,y1),(z2,y2),…,(zn,yn)},属性集A={a1,a2,…am}为根节点,其中,yi为对应数据zi的类别,每一条数据zi都具有m个属性,i=1,2,...,n;(2)若所有数据的类别都相同,将该节点标记为叶节点,将该类别作为这个节点的类别,否则进入步骤(3);(3)选取基尼指数最小的属性aj作为划分依据,根据属性中不同取值的个数,将当前节点分成若干个子节点,子节点的属性集A’=A‑aj;(4)对每个子节点重复步骤(2);(5)当一个子节点中的数据不属于同一类别并且没有能用于继续划分的属性时,以该节点中数量最多的类别作为当前节点的类别;(6)综合统计所有决策树的分类结果,得票最多的类别作为数据集X的类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710590718.4/,转载请声明来源钻瓜专利网。
- 上一篇:指纹信息获取方法及终端
- 下一篇:一种功能等价体集合的异构度评估方法及系统