[发明专利]基于工业物联网设备Web管理页面的设备识别方法在审
| 申请号: | 202010193308.8 | 申请日: | 2020-03-18 |
| 公开(公告)号: | CN111460803A | 公开(公告)日: | 2020-07-28 |
| 发明(设计)人: | 张淼;徐国爱;杨以琳;王浩宇;郭燕慧;徐国胜 | 申请(专利权)人: | 北京邮电大学 |
| 主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F16/903;G06F40/169;G06K9/62 |
| 代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 张拥 |
| 地址: | 100876 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 工业 联网 设备 web 管理 页面 识别 方法 | ||
1.一种基于工业物联网设备Web管理页面的设备识别方法,其特征在于,包括:
获取基于工业物联网设备Web管理页面的样本数据并进行预处理;
对预处理后的样本数据中的各个样本进行关键信息提取;
利用关联规则挖掘算法处理所述关键信息,获得各型号工业物联网对应的设备识别规则;
根据所述设备识别规则对待测样本进行设备信息标注;所述设备信息包括设备的类型、品牌和型号。
2.根据权利要求1所述的基于工业物联网设备Web管理页面的设备识别方法,其特征在于,所述基于工业物联网设备Web管理页面的样本数据是基于ZoomEye开放的API和爬虫技术获取的;
所述预处理的步骤包括:
对所获取的样本数据中的非工业物联网设备的样本进行剔除;
对于样本中HTTP响应状态码为3xx、4xx、5xx的数据进行剔除;
将所述基于工业物联网设备Web管理页面的样本数据按照组件信息进行合并。
3.根据权利要求1所述的基于工业物联网设备Web管理页面的设备识别方法,其特征在于,所述对预处理后的样本数据中的各个样本进行关键信息提取的步骤包括:
对预处理后的样本数据中的各个样本进行关键信息提取;所述关键信息包括数据包头部Server字段、数据包头部WWW-Authenticate字段、响应体中的title字段、meta标签中的copyright信息、meta标签中的description信息、a标签中的href属性字段或注释中的copyright信息;
将各个样本提取后的关键信息生成字符串;所述字符串包括七个关键信息中的任意字段组合,字段间以“;”相隔。
4.根据权利要求1所述的基于工业物联网设备Web管理页面的设备识别方法,其特征在于,所述利用关联规则挖掘算法处理所述关键信息,获得各型号工业物联网对应的设备识别规则的步骤包括:
将各个样本所提取的关键信息以key:value;...;key:value的形式,作为关联规则A=B中的A;
所述基于工业物联网设备Web管理页面的样本数据中提取的设备类型、品牌和型号信息作为关联规则A=B中的B;
通过Apriori算法选择频繁项集,并在迭代寻找频繁项集的超集时以最小支持度作为阈值去除不符合条件的项集,然后留下大于置信度阈值的频繁项规则,最后从生成的规则中找出包含项B的最高置信度A=B规则作为最终工业物联网设备Web管理页面与设备类型、品牌和型号信息的关联规则;
针对各型号工业物联网设备都完成关联规则提取后,以{key:value;...;key:value;}=(type,vendor,model)的形式作为设备识别规则,并存储在工业物联网设备规则库文件中。
5.根据权利要求1所述的基于工业物联网设备Web管理页面的设备识别方法,其特征在于,所述根据所述设备识别规则对待测样本进行设备信息标注的步骤包括:
对待测样本进行关键信息提取;
将待测样本提取后的关键信息生成字符串;
将待测样本的字符串与所述设备识别规则进行匹配,对待测样本进行设备信息标注。
6.根据权利要求5所述的基于工业物联网设备Web管理页面的设备识别方法,其特征在于,所述将待测样本的字符串与所述设备识别规则进行匹配,对待测样本进行设备信息标注的步骤包括:
将待测样本的字符串与设备识别规则中的字符串部分进行字符串相似度计算;
根据相似度对待测样本进行设备信息标注。
7.根据权利要求6所述的基于工业物联网设备Web管理页面的设备识别方法,其特征在于,所述将待测样本的字符串与设备识别规则中的字符串部分进行字符串相似度计算的步骤包括:
将待测样本的字符串与工业物联网设备规则库文件中的每条设备识别规则中的项A部分进行字符串相似度计算;其中,在进行字符串相似度计算时,只取待测样本的字符串中含有的字段参与运算,只有所述字段与设备识别规则中含有的字段一致时才进行后续匹配,否则直接跳过所述设备识别规则。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010193308.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种燃气灶定时开关
- 下一篇:一种数据推送方法及装置





