[发明专利]一种物联网消息协议状态机的跨平台自动化挖掘方法与系统有效
申请号: | 202010856474.1 | 申请日: | 2020-08-24 |
公开(公告)号: | CN112019403B | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 纪守领;王琴应;陈建海;林昶廷;王滨 | 申请(专利权)人: | 杭州弈鸽科技有限责任公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L29/06 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 311100 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 联网 消息 协议 状态机 平台 自动化 挖掘 方法 系统 | ||
1.一种物联网消息协议状态机的跨平台自动化挖掘方法,其特征在于,通过协议关键字段、字段语义信息挖掘和协议交互逻辑挖掘,自动化构建协议状态机,具体包括以下步骤:
(1)对消息协议的数据包进行特征提取和分类,对消息协议进行字段分割,并挖掘消息协议的字段语义信息;
(2)应用基于容错学习策略的状态机模糊测试模型,实现自动化挖掘协议的交互逻辑,并构建可视化的协议交互状态机;包括以下步骤:
(2-1)基于同一会话的报文特征,构建输入输出单词表,设置状态机模糊测试适配器,测试对象为平台部署的协议代理;
所述的适配器用于实现输入单词和真实测试的映射关系,以及输出单词和测试协议代理响应的映射关系;选择输入的单词序列,并由适配器转换为真实的发送数据包或者重置动作,协议代理接受数据包或重置动作后做出响应,并被适配器捕获,转换为输出单词序列;
(2-2)在测试阶段引入测试延迟,所述测试阶段包括基于MAT模型的成员查询测试和等价查询测试;在成员查询测试过程中,对多组不同排列组合的输入单词序列进行测试,测试后得到相应的输出单词序列,并基于多组输入单词序列和输出单词序列之间的对应关系,得到初步的协议交互状态机假设,并使用DOT语言进行可视化;
(2-3)在得到初步的协议交互状态机假设后,设计基于剪枝的W-Method的等价查询算法来判断假设是否和真实的协议部署一致;在等价查询测试过程中,当某个输入单词对应的输出单词显示协议的连接已经断开时,则该输入单词所在的单词序列的等价查询测试将停止,并开始选择新的输入单词序列进行新一轮的等价查询测试;
(2-4)设计基于阈值的学习策略避免学习算法陷入循环;
若步骤(2-3)中的等价查询过程出现一个输入单词和输出单词的结果与协议交互状态机假设不一致时,则基于该对输入单词和输出单词更新协议状态机假设,并进行新一轮的等价查询测试;
若等价查询过程中所有输入单词和输出单词的结果与协议交互状态机假设完全一致时,或者经过多轮学习后连续生成相同协议状态机的数量达到阈值时,将停止等价查询测试,以最新得到的协议状态机作为最终状态机模糊测试得到的协议交互状态机;
(3)结合消息协议的语义信息和交互逻辑,对步骤(2)构建的可视化的协议交互状态机进行细粒度优化,实现自动化构建细粒度协议状态机;包括以下步骤:
(3-1)遍历步骤(2)所述的协议交互状态机的协议转换标签,匹配步骤(1)所述的字段语义信息,构建富含语义和交互逻辑的细粒度协议状态机;
(3-2)在步骤(3-1)得到的细粒度协议状态机基础上,对时间相关的字段设计发包测试,验证字段的有效性,优化协议状态机。
2.根据权利要求1所述的物联网消息协议状态机的跨平台自动化挖掘方法,其特征在于,步骤(1)对消息协议的数据包进行特征提取和分类,对消息协议进行字段分割,并挖掘消息协议的语义信息,包括以下步骤:
(1-1)根据消息协议的特征,从给定流量中提取出所有特定协议的报文,并根据协议规范中要求的报文格式确定各个报文的类型;对各个类型报文字段的相关性进行对比,并对所有报文进行聚类,将同一会话产生的报文归为一类;
(1-2)建立密码学函数指纹库,基于函数指纹来识别报文中字段的特定模式,包括字段的值及其对应的语义;并针对同一会话中的报文字段构建语义字典,所述语义字典中存储有字段的值及其语义;
(1-3)针对非密码学函数模式的字段,搜索报文中蕴含语义信息的等价式,并完善语义字典;
(1-4)基于连接符对字段进一步分割;
(1-5)基于步骤(1-3)完善后的语义字典,对步骤(4)分割后得到的所有字段进行语义识别,并将无法识别语义的字段按时间顺序不重复地编号,完成消息协议的字段语义信息的挖掘。
3.根据权利要求1所述的物联网消息协议状态机的跨平台自动化挖掘方法,其特征在于,步骤(2-1)所述的输入输出单词表由输入单词和输出单词构成,其中输入单词是模糊测试中的输入测试的抽象,输出单词是状态机模糊测试模型中测试对象的响应的抽象。
4.根据权利要求1所述的物联网消息协议状态机的跨平台自动化挖掘方法,其特征在于,所述的成员查询测试过程中,采用Angluin’s L*、TTT或者Kearns Vazirani学习算法中的任意一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州弈鸽科技有限责任公司,未经杭州弈鸽科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010856474.1/1.html,转载请声明来源钻瓜专利网。