[发明专利]一种页面检测方法及装置有效
申请号: | 201910955399.1 | 申请日: | 2019-10-09 |
公开(公告)号: | CN110795731B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 马文强 | 申请(专利权)人: | 新华三信息安全技术有限公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 230001 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 页面 检测 方法 装置 | ||
本申请提供了一种页面检测方法及装置。方案如下:获取待检测页面的脚本语言代码;将脚本语言代码划分为多个词法片段,并确定每一词法片段对应的片段类型;按照每一词法片段在脚本语言代码中的位置,组合多个词法片段对应的片段类型,得到目标Token流;对目标Token流中片段类型对应的词法片段进行表达式化简,得到脚本语言代码对应的简化代码;将简化代码输入预设安全引擎,检测待检测页面是否为恶意页面。应用本申请实施例提供的技术方案,提高了恶意代码的正确率,降低了用户信息泄露的概率,提高了网络的安全性。
技术领域
本申请涉及安全防护技术领域,特别是涉及一种页面检测方法及装置。
背景技术
Javascript(简称:JS)是一种直译式脚本语言。JS广泛的应用于超文本标记语言(英文:Hyper Text Markup Language,简称:HTML)页面中,从而给浏览器显示的HTML页面增加动态功能。
目前,非法用户可以利用浏览器漏洞来进行网页挂马。例如,非法用户针对浏览器漏洞在HTML页面中植入恶意的JS代码(以下简称恶意代码),当合法用户通过未修补漏洞的浏览器访问携带恶意代码的HTML页面时,将会触发该恶意代码,造成用户信息的泄露,网络安全性差。
发明内容
有鉴于此,本申请的目的在于提供一种页面检测方法及装置,以提高恶意代码的正确率,降低用户信息泄露的概率,提高网络的安全性。具体技术方案如下:
第一方面,本申请提供了一种页面检测方法,该方法包括:
获取待检测页面的脚本语言代码;
将所述脚本语言代码划分为多个词法片段,并确定每一词法片段对应的片段类型;
按照每一词法片段在所述脚本语言代码中的位置,组合多个词法片段对应的片段类型,得到目标令牌(英文:Token)流;
对所述目标Token流中片段类型对应的词法片段进行表达式化简,得到脚本语言代码对应的简化代码。
结合第一方面,在第一种可能的实施方式中,上述方法还包括:
接收所述待检测页面的多个脚本语言代码片段,所述多个脚本语言代码片段组成所述待检测页面的脚本语言代码;
将所述多个脚本语言代码片段缓存到预设缓存空间中;
所述获取待检测页面的脚本语言代码,包括:
从所述预设缓存空间中,读取所述多个脚本语言代码片段。
结合第一方面或第一方面的第一种可能的实施方式中,在第二种可能的实施方式中,所述将所述脚本语言代码划分为多个词法片段,包括:
将所述脚本语言代码中的每一运算符划分为一个词法片段;
将所述脚本语言代码中除运算符外的连续至少一个字符划分为一个词法片段。
结合第一方面的第二种可能的实施方式,在第三种可能的实施方式中,所述确定每一词法片段对应的片段类型,包括:
对于每一词法片段,若该词法片段为运算符,则将该词法片段作为该词法片段的片段类型;
若该词法片段为连续至少一个字符,检测该词法片段是否与预设语法运算函数中的连续至少一个字符匹配;若匹配,则确定该词法片段的片段类型为标识类型;若否,则确定该词法片段的片段类型为字符类型。
结合第一方面的第三种可能的实施方式,在第四种可能的实施方式中,所述按照每一词法片段在所述脚本语言代码中的位置,组合多个词法片段对应的片段类型,得到目标Token流,包括:
将所述脚本语言代码中每一词法片段替换为该词法片段对应的片段类型,得到初始Token流;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华三信息安全技术有限公司,未经新华三信息安全技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910955399.1/2.html,转载请声明来源钻瓜专利网。