[发明专利]一种识别报文所属组件的方法和计算设备有效
申请号: | 201710363681.1 | 申请日: | 2017-05-22 |
公开(公告)号: | CN107241237B | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | 胡健 | 申请(专利权)人: | 北京知道创宇信息技术股份有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;G06N3/08 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 谢建云;赵爱军 |
地址: | 100102 北京市朝阳区阜*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 报文 所属 组件 方法 计算 设备 | ||
1.一种识别报文所属组件的方法,适于在计算设备中执行,该方法包括步骤:
从待识别报文中提取至少一个关键字段;
对于所提取的一个关键字段,
利用搜索引擎查询该关键字段,以得到多个包含有所述关键字段的报文、以及返回该报文的IP地址;
分别获取查询到的每个IP地址指向的网络内容的截图,所述截图经由浏览器访问IP地址后将显示在浏览器上的网络内容截图得到;
根据所获取的多个网络内容的截图来判断所述关键字段是否有效;
对于基于有效的关键字段而获取的每个报文,均计算该报文与待识别报文的相似差值;
选取其中相似差值最小的预定数目个报文,根据该预定数目个报文,采用预先建立的深度学习模型来获取待识别报文的组件信息;以及
根据所述组件信息确定所述待识别报文所属的组件。
2.如权利要求1所述的方法,其中,所述提取至少一个关键字段的步骤包括:
根据预置的关键字集合,在待识别的报文中通过字符串匹配得到至少一个关键字段。
3.如权利要求1所述的方法,其中,所述搜索引擎包括ZoomEye和Shadon搜索引擎。
4.如权利要求1所述的方法,其中,所述判断关键字段是否有效的步骤包括:
对于所获取的多个网络内容的截图,判断其中每两个网络内容的截图是否相似;
若所得到的多个判断结果中不相似的数目没有超过预定比例,则确定所述关键字段有效,否则确定所述关键字段无效。
5.如权利要求4所述的方法,其中,还包括步骤:
在确定一个关键字段无效之后,继续对其他的无效字段重复上述查询、获取、判断是否有效的步骤,直至确定某个关键字段有效、或者全部关键字段无效为止。
6.如权利要求1所述的方法,其中,判断两个网络内容的截图是否相似的步骤包括:
使用SIFT算法分别提取两个截图的SIFT特征;
通过对两个截图的SIFT特征进行匹配,来判断两个截图是否相似。
7.如权利要求1所述的方法,其中,计算两个报文之间的相似差值的步骤包括:
删除两个报文所包含的时间信息;
利用Levenshtein算法计算两个报文之间的相似差值。
8.如权利要求1-7中任一个所述的方法,其中,所述深度学习模型为深度学习神经网络。
9.一种计算设备,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行如权利要求1-8所述的方法中的任一方法的指令。
10.一种存储程序的可读存储介质,所述程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行如权利要求1-8中任一个所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京知道创宇信息技术股份有限公司,未经北京知道创宇信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710363681.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:作为RORc调节剂的芳基磺内酰胺衍生物
- 下一篇:一种美司钠的制备方法