[发明专利]数据解析方法、装置、电子设备及存储介质在审
申请号: | 202111480627.8 | 申请日: | 2021-12-06 |
公开(公告)号: | CN114157734A | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 刘禄丹;张云禄 | 申请(专利权)人: | 北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司 |
主分类号: | H04L69/22 | 分类号: | H04L69/22 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 杨奇松 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 解析 方法 装置 电子设备 存储 介质 | ||
本申请提供一种数据解析方法、装置、电子设备及存储介质,涉及网络通信安全技术领域。该方法应用于服务器,服务器中设置有第一状态机和第二状态机,该方法包括:根据目标数据的边界关键信息对第一状态机进行配置,得到边界状态机;根据目标数据的头部关键信息对第二状态机进行配置,得到头部状态机;基于边界状态机对目标数据进行解析,确定目标数据的目标实体;基于头部状态机对目标实体进行解析,得到解析数据。本申请对两个状态机分别进行配置,分别对数据的边界和头部进行解析,通过边界状态机确定对应的目标实体,通过头部状态机对目标实体完成解析,得到解析数据。能够灵活地处理数据实体的逻辑和嵌套关系,提高了数据的解析效率。
技术领域
本申请涉及网络通信安全技术领域,具体而言,涉及一种数据解析方法、装置、电子设备及存储介质。
背景技术
随着互联网的发展迅速以及普及,人们日常生活都与网络息息相关。日常的购物、社交、工作、生活等都离不开网络。随着不断网络化的现在,网络流量也与日俱增。庞大的流量对审计检测带来很大的挑战。
在现实网络流量中MIME(Multipurpose Internet Mail Extensions,多用途互联网邮件扩展类型)传输数据格式应用非常广泛,如HTTP(Hyper Text Transfer Protocol,超文本传输协议)协议和邮件协议。由于MIME数据在网络流量中的占比较大,而现有技术中在对MIME数据进行解析时,通常采用逐行读取的方式进行解析,解析内存占用高且存在解析异常风险,无法对数据进行灵活解析,导致MIME数据的解析效率较低,影响审计检测工作的效率。
发明内容
有鉴于此,本申请实施例的目的在于提供一种数据解析方法、装置、电子设备及存储介质,以改善现有技术中存在的数据的解析效率较低的问题。
为了解决上述问题,第一方面,本申请提供了一种数据解析方法,应用于服务器,所述服务器中设置有第一状态机和第二状态机,所述方法包括:
根据目标数据的边界关键信息对所述第一状态机进行配置,得到边界状态机;
根据所述目标数据的头部关键信息对所述第二状态机进行配置,得到头部状态机;
基于所述边界状态机对所述目标数据进行解析,确定所述目标数据的目标实体;
基于所述头部状态机对所述目标实体进行解析,得到解析数据。
在上述实现方式中,分别根据目标数据的边界关键信息和头部关键信息对服务器中设置的第一状态机和第二状态机进行配置,能够对第一状态机和第二状态机分别进行初始化地预处理,配置得到对应的边界状态机和头部状态机。通过边界状态机对目标数据进行解析,能够确定目标数据中的目标实体,通过头部状态机对目标实体进行解析,能够解析模板实体中的实体部分,得到完成的解析数据。能够通过两个状态机对目标数据中的实体位置和实体部分分别进行处理,可以快速地提取目标数据中的有效字段,以在数据解析时跳过无效数据,减小解析时的内存压力,便于用户进行调试和跳跃解析,降低了目标数据的解析维度,提高了目标数据的解析效率和灵活性。
可选地,所述基于所述边界状态机对所述目标数据进行解析,确定所述目标数据的目标实体,包括:
使用所述边界状态机对所述目标数据进行检测,得到边界标志;
根据所述边界标志,对所述目标数据进行解析,得到实体开始位置和实体结束位置;
基于所述实体开始位置和所述实体结束位置,确定所述目标实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司,未经北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111480627.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置