[发明专利]正则表达式的匹配方法、装置、电子设备及存储介质有效
申请号: | 201911421987.3 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111177491B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 王彬;覃永靖;程诗尧;马江波 | 申请(专利权)人: | 奇安信科技集团股份有限公司;奇安信网神信息技术(北京)股份有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/951;G06F16/2455 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 郑朝然 |
地址: | 100088 北京市西城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 正则 表达式 匹配 方法 装置 电子设备 存储 介质 | ||
本发明实施例提供了一种正则表达式的匹配方法、装置、电子设备及存储介质,在抽取标识每一正则表达式的字符串后,将字符串划分为定长子串。通过定长子串去过滤与待匹配字符串匹配性较好的目标正则表达式,通过目标正则表达式进一步地确定待匹配字符串是否为网络攻击数据或者病毒。由于对字符串划分了定长子串,过滤器中只需要存储各字符组成长度为定长子串的所有可能字符串。相比于存储每一正则表达式完整的字符串而言,大大降低了所需的存储空间,且定长子串的所有可能字符串所需最大存储空间可控,能够避免过滤器发生内存溢出错误。
技术领域
本发明涉及计算机技术领域,尤其是涉及一种正则表达式的匹配方法、装置、电子设备及存储介质。
背景技术
海量(千万级)正则表达式匹配引擎通常采用过滤方法实现,包含“过滤器”和“验证器”两大核心模块。“过滤器”采用抽取的有效指纹构建自动机实现,“验证器”采用NFA-DFA正则表达式引擎实现。但是,现有的“有效指纹”提取算法,均是针对“连接”操作的关键子串,没有考虑正则表达式的“或”操作,进而过滤能力较低,并且“有效指纹”长度不可控,容易发生内存溢出错误。
由此,在实际应用过程中,由于正则表达式的长度不可控,正则表达式匹配过程中,尤其是存在大规模的正则表达式时,过滤器中需要大量的空间存放正则表达式的“有效指纹”,容易出现内存溢出,发生内存溢出错误。
发明内容
本发明实施例提供一种正则表达式的匹配方法、装置、电子设备及存储介质,用以解决现有技术中的由于正则表达式的长度不可控,正则表达式匹配过程中,尤其是存在大规模的正则表达式时,过滤器中需要大量的空间存放正则表达式的“有效指纹”,容易出现内存溢出,发生内存溢出错误的问题。
针对以上技术问题,第一方面,本发明的实施例提供了一种正则表达式的匹配方法,包括:
抽取用于标识每一正则表达式的字符串,并将每一字符串划分为定长子串;
获取从网络抓取的待匹配字符串,将与所述待匹配字符串相匹配的定长子串作为目标定长子串;
根据所述目标定长子串的顺序和内容,确定与所述待匹配字符串相匹配的目标正则表达式,以根据目标正则表达式判定所述待匹配字符串的安全性。
第二方面,本发明的实施例提供了一种正则表达式的匹配装置,包括:
划分模块,用于抽取用于标识每一正则表达式的字符串,并将每一字符串划分为定长子串;
匹配模块,用于获取从网络抓取的待匹配字符串,将与所述待匹配字符串相匹配的定长子串作为目标定长子串;
确定模块,用于根据所述目标定长子串的顺序和内容,确定与所述待匹配字符串相匹配的目标正则表达式,以根据目标正则表达式判定所述待匹配字符串的安全性。
第三方面,本发明的实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以上所述的正则表达式的匹配方法的步骤。
第四方面,本发明的实施例提供一种非暂态可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以上所述的正则表达式的匹配方法的步骤。
本发明的实施例提供了一种正则表达式的匹配方法、装置、电子设备及存储介质,在抽取标识每一正则表达式的字符串后,将字符串划分为定长子串。通过定长子串去过滤与待匹配字符串匹配性较好的目标正则表达式,通过目标正则表达式进一步地确定待匹配字符串是否为网络攻击数据或者病毒。由于对字符串划分了定长子串,过滤器中只需要存储各字符组成长度为定长子串的所有可能字符串。相比于存储每一正则表达式完整的字符串而言,大大降低了所需的存储空间,且定长子串的所有可能字符串所需最大存储空间可控,能够避免过滤器发生内存溢出错误。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奇安信科技集团股份有限公司;奇安信网神信息技术(北京)股份有限公司,未经奇安信科技集团股份有限公司;奇安信网神信息技术(北京)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911421987.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多标记业务处理的方法及装置
- 下一篇:脉管封闭装置