[发明专利]基于MapReduce并行AP聚类的网络入侵检测方法在审

申请号：	201410643024.9	申请日：	2014-11-14
公开（公告）号：	CN104378371A	公开（公告）日：	2015-02-25
发明（设计）人：	陈铁明;张旭	申请（专利权）人：	浙江工业大学
主分类号：	H04L29/06	分类号：	H04L29/06
代理公司：	杭州斯可睿专利事务所有限公司 33241	代理人：	王利强
地址：	310014 浙江省杭州市***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于MapReduce并行AP聚类的网络入侵检测方法，所述检测方法包括如下步骤：第一步，入侵检测样本数据预处理，完成特征数据的数值化和归一化；第二步，利用基于MapReduce的并行AP聚类压缩入侵检测样本数；第三步，利用压缩后的数据样本，通过KNN或SVM分类器实现高效检测。本发明提供一种基于MapReduce并行AP聚类的网络入侵检测方法，对数据样本处理具备良好的扩展性，可实现对海量数据样本的有效压缩，提高检测速度和检测精度。
搜索关键词：	基于 mapreduce 并行 ap 网络入侵检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于MapReduce并行AP聚类的网络入侵检测方法，其特征在于：所述检测方法包括如下步骤：第一步，入侵检测样本的预处理，即完成特征数据的数值化和归一化处理；第二步，利用基于MapReduce的并行AP聚类压缩入侵检测样本数，过程如下：(2.1)相似度矩阵计算的MapReduce并行化AP聚类采用欧式距离的负值来衡量数据点间的相似度，欧式距离的计算公式：

<mrow><mi>s</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msubsup><mi>x</mi><mi>k</mi><mn>2</mn></msubsup><mo>+</mo><munderover><mi>Σ</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msubsup><mi>y</mi><mi>k</mi><mn>2</mn></msubsup><mo>-</mo><mn>2</mn><munderover><mi>Σ</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>x</mi><mi>k</mi></msub><msub><mi>y</mi><mi>k</mi></msub></mrow>

并行化计算的输入可以看成是每行保存一个数据点的矩阵A，公式的前两项和第三项可以分开算，前两项计算时每个节点不依赖其它节点上的数据，每个节点都可以单独计算存储在自身节点上数据点的各个维度的平方和，而第三项实际就是输入矩阵A与其转置矩阵A^T相乘得到的矩阵T的第i行第j列的值，假设x是第i个点，而y是第j个点，因此第三项的计算采用类似于并行化计算矩阵相乘的方法；第三项的计算过程如下：

<mfenced open='' close=''><mtable><mtr><mtd><mi>A</mi><mfenced open='[' close=']'><mtable><mtr><mtd><mi>a</mi><mn>11</mn><mo>,</mo><mi>a</mi><mn>12</mn></mtd></mtr><mtr><mtd><mi>a</mi><mn>21</mn><mo>,</mo><mi>a</mi><mn>22</mn></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>></mo><msup><mi>A</mi><mi>T</mi></msup><mfenced open='[' close=']'><mtable><mtr><mtd><mi>a</mi><mn>11</mn><mo>,</mo><mi>a</mi><mn>21</mn></mtd></mtr><mtr><mtd><mi>a</mi><mn>12</mn><mo>,</mo><mi>a</mi><mn>22</mn></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>></mo><mfenced open='[' close=']'><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mi>a</mi><mn>11</mn><mo>×</mo><mi>a</mi><mn>11</mn></mtd><mtd><mi>a</mi><mn>11</mn><mo>×</mo><mi>a</mi><mn>21</mn></mtd></mtr><mtr><mtd><mn>2</mn></mtd><mtd><mn>0</mn></mtd><mtd><mi>a</mi><mn>21</mn><mo>×</mo><mi>a</mi><mn>21</mn></mtd></mtr><mtr><mtd><mn>1</mn></mtd><mtd><mi>a</mi><mn>12</mn><mo>×</mo><mi>a</mi><mn>12</mn></mtd><mtd><mi>a</mi><mn>12</mn><mo>×</mo><mi>a</mi><mn>22</mn></mtd></mtr><mtr><mtd><mn>2</mn></mtd><mtd><mn>0</mn></mtd><mtd><mi>a</mi><mn>22</mn><mo>×</mo><mi>a</mi><mn>22</mn></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>></mo></mtd></mtr><mtr><mtd><mfenced open='[' close=']'><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mi>a</mi><mn>11</mn><mo>×</mo><mi>a</mi><mn>11</mn><mo>+</mo><mi>a</mi><mn>12</mn><mo>×</mo><mi>a</mi><mn>12</mn></mtd><mtd><mi>a</mi><mn>11</mn><mo>×</mo><mi>a</mi><mn>21</mn><mo>+</mo><mi>a</mi><mn>12</mn><mo>×</mo><mi>a</mi><mn>22</mn></mtd></mtr><mtr><mtd><mn>2</mn></mtd><mtd><mn>0</mn></mtd><mtd><mi>a</mi><mn>21</mn><mo>×</mo><mi>a</mi><mn>21</mn><mo>+</mo><mi>a</mi><mn>22</mn><mo>×</mo><mn>22</mn></mtd></mtr></mtable></mfenced></mtd></mtr></mtable></mfenced>

先对输入矩阵A转置，然后求每行中各项与其后面各项的乘积，并以各项所在的列作为行键，最后对相同行键的行进行纵向求和汇总即可得到欧式距离计算公式中第三项的值；(2.2)吸引度矩阵和归属度矩阵计算的MapReduce并行化用MapReduce并行化计算吸引度值时在Map中将相似度值s(i,k)和归属度值a(i，k)以其所在行作为键输出，使同一行的a(i,k)和s(i,k)洗牌到(Shuffle)同一reduce的节点进行计算，而计算归属度值时可以在Map中将吸引度值r(i,k)以其所在列作为键输出，使同一列的r(i,k)洗牌到同一reduce节点进行计算，使用了Point结构来保存s(i，k)、r(i,k)和a(i,k)；在Map阶段以Point所在列为键输出，Reduce阶段计算同一列的归属度值；(2.3)聚类中心计算的MapReduce并行化计算聚类中心时只用到a(k,k)和r(k,k)的值，而使用Point同时保存了这两个值，所以各个节点独立计算本节点上的数据点有哪些是聚类中心，并行化计算聚类中心时在Map阶段判断本节点上有哪些数据点是聚类中心，输出是聚类中心的点，而在reduce阶段汇总各个节点的计算结果，得到最终的聚类中心，以此完成数据样本压缩；第三步，基于MapReduce的AP并行化聚类处理获得压缩后的数据样本，再利用KNN或SVM分类器实现入侵检测。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工业大学，未经浙江工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201410643024.9/，转载请声明来源钻瓜专利网。

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L29-00 H04L 1/00至H04L 27/00单个组中不包含的装置、设备、电路和系统
H04L29-02 .通信控制；通信处理
H04L29-12 .以数据终端为特征的
H04L29-14 .故障的应对措施
H04L29-04 ..用于多条通信线路的
H04L29-06 ..以协议为特征的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于MapReduce并行AP聚类的网络入侵检测方法在审

专利文献下载