[发明专利]一种基于误码率模型的未知通信协议识别方法有效
申请号: | 201710093147.3 | 申请日: | 2017-02-21 |
公开(公告)号: | CN106878307B | 公开(公告)日: | 2019-10-29 |
发明(设计)人: | 蔡乐;石荣;许都 | 申请(专利权)人: | 电子科技大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于误码率模型的未知通信协议识别方法,通过将多模式匹配算法和关联规则分析算法相结合,提取已知协议的协议特征串,构建协议特征库。然后,在识别被识别数据采用的协议类型的时候,计算被识别数据允许的最大误比特数,并在此误比特数范围内采用模糊匹配算法提取被识别数据的特征串。最后,通过自动推理得到被识别数据所采用的协议类型。因此,本识别方法能够提高数据识别率,对于具有误码的数据具有良好的识别效果。 | ||
搜索关键词: | 一种 基于 误码率 模型 未知 通信协议 识别 方法 | ||
【主权项】:
1.一种基于误码率模型的未知通信协议识别方法,其特征在于,包括以下步骤:(1)、数据采集及预处理利用网络抓包工具抓取网络中的通信数据,再将通信数据按照帧格式进行存储,且每一帧进行二进制处理,最后将处理完成的已知协议通信数据作为训练数据,将未知协议通信数据作为被识别数据;(2)、对训练数据进行特征提取,得到协议特征库(2.1)、利用模式匹配算法提取频繁集根据已有网络协议特征字符串允许的长度,穷举所有的1~6字节的二进制字符串,记为{p1,p2,p3,......,pm},pm表示第m个二进制字符串,最后将穷举的所有二进制字符串作为模式字符串;提取训练数据中的每一帧数据,组成目标字符串{t1,t2,t3,......,tn},tn表示第n帧数据;将{p1,p2,p3,......,pm}和{t1,t2,t3,......,tn}作为模式匹配算法的输入,通过模式匹配算法进行匹配,并记录匹配成功的模式字符串以及其在目标字符串中的位置,最后统计相同位置上出现同一模式字符串的帧数,并将帧数占比大于M%的模式字符串定义为此协议的频繁字符串,最后将所有频繁字符串组成频繁集{f1,f2,f3,......,fK},fK表示第K个频繁字符串;(2.2)、利用关联规则分析算法提取协议特征将频繁集{f1,f2,f3,......,fK}及频繁字符串在各个帧中出现的位置作为关联规则分析算法的输入,通过关联规则分析算法对频繁字符串进行关联规则分析,得到关联字符串,再统计出关联字符串出现的次数和位置,并将关联字符串出现的次数占比大于M%的关联字符串作为识别规则,再将识别规则中的频繁字符串{f1,f2,f3,......,fk}存入协议特征库中,其中,fk表示第k(k≤K)个频繁字符串;(3)、利用模糊匹配算法获取模糊特征集(3.1)、计算被识别数据允许的最大误比特数
其中,L1表示允许的最长特征串的长度,L2表示被识别数据帧的帧长度,FER表示被识别数据的误帧率;(3.2)、根据协议特征库,利用模糊匹配算法提取最大误比特数范围内的所有模糊特征字符串将被识别数据、频繁字符串{f1,f2,f3,......,fk}和被识别数据允许的最大误比特数作为模糊匹配算法的输入,通过模糊匹配算法进行匹配,记录匹配成功的模糊特征字符串及其在被识别数据帧中的位置,并存入到模糊特征集中;(4)、采用Jena自动推理机识别帧的协议类型首先建立推理规则库,再将模糊特征集中的模糊特征字符串和推理规则库作为Jena自动推理机的输入,并进行推理,得出每一组模糊特征字符串所对应的协议类型,即为此帧的协议类型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710093147.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种设置语音交互设备的系统和方法
- 下一篇:一种ICMP报文匹配系统及方法