[发明专利]压缩文本检测方法和装置有效
| 申请号: | 201611033285.4 | 申请日: | 2016-11-18 |
| 公开(公告)号: | CN106789895B | 公开(公告)日: | 2020-03-27 |
| 发明(设计)人: | 侯智瀚 | 申请(专利权)人: | 东软集团股份有限公司 |
| 主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L29/08 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
| 地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 压缩 文本 检测 方法 装置 | ||
本申请提出一种压缩文本检测方法和装置,该压缩文本检测方法包括:获取待检测的压缩文本;对所述压缩文本进行模式匹配,获取输出序列;根据所述输出序列和已建立的特征命中概率计算模型,计算所述压缩文本的特征命中概率,并根据所述特征命中概率得到所述压缩文本对应的向量;根据所述向量和已建立的分类模型,确定所述压缩文本属于的类别。该方法能够避免对压缩文本放弃检测或延迟检测,从而兼顾网络传输安全和网络传输质量。
技术领域
本申请涉及数据检测技术领域,尤其涉及一种网关位置压缩文本检测方法和装置。
背景技术
网络为人们提供方便的同时,网络攻击问题也带来了新的麻烦与威胁。web是一种广泛被采用的网络服务,同时也是不法攻击者传播恶意代码的主要手段。通常在检测web攻击时,需要分析非压缩格式的待检测的文本内容,对文本内容进行模式匹配,根据特征串的输出序列进行后续判断。
gzip是web传输文本的常见压缩编码形式,在进行数据文本与特征串匹配之前,需要进行解压缩。但gzip压缩采用LZ77算法需要为每个文件分配32KB的内存数据窗口。在高并发会话的网关设备中,没有足够的资源为每个会话分配32KB的空间,或者会造成遗漏检测,或者主动降低并发会话数量进而导致网络中断或大幅延迟,影响通信质量。也就是说,相关技术中在网关位置对压缩文本进行检测时,会放弃检测或者延迟检测,但是放弃检测会造成安全风险,延迟检测会影响网络传输质量。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的一个目的在于提出一种压缩文本检测方法,该方法可以避免对压缩文本放弃检测或延迟检测,从而兼顾网络传输安全和网络传输质量。
本申请的另一个目的在于提出一种压缩文本检测装置。
为达到上述目的,本申请第一方面实施例提出的压缩文本检测方法,包括:获取待检测的压缩文本;对所述压缩文本进行模式匹配,获取输出序列;根据所述输出序列和已建立的特征命中概率计算模型,计算所述压缩文本的特征命中概率,并根据所述特征命中概率得到所述压缩文本对应的向量;根据所述向量和已建立的分类模型,确定所述压缩文本属于的类别。
本申请第一方面实施例提出的压缩文本检测方法,通过对压缩文本进行模式匹配,不需要先进行解压缩,可以避免对压缩文本放弃检测或延迟检测,从而兼顾网络传输安全和网络传输质量。
为达到上述目的,本申请第二方面实施例提出的压缩文本检测装置,包括:获取模块,用于获取待检测的压缩文本;模式匹配模块,用于对所述压缩文本进行模式匹配,获取输出序列;向量确定模块,用于根据所述输出序列和已建立的特征命中概率计算模型,计算所述压缩文本的特征命中概率,并根据所述特征命中概率得到所述压缩文本对应的向量;类别确定模块,用于根据所述向量和已建立的分类模型,确定所述压缩文本属于的类别。
本申请第二方面实施例提出的压缩文本检测装置,通过对压缩文本进行模式匹配,不需要先进行解压缩,可以避免对压缩文本放弃检测或延迟检测,从而兼顾网络传输安全和网络传输质量。
本申请实施例还提出了一种设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:获取待检测的压缩文本;对所述压缩文本进行模式匹配,获取输出序列;根据所述输出序列和已建立的特征命中概率计算模型,计算所述压缩文本的特征命中概率,并根据所述特征命中概率得到所述压缩文本对应的向量;根据所述向量和已建立的分类模型,确定所述压缩文本属于的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611033285.4/2.html,转载请声明来源钻瓜专利网。





