[发明专利]一种非法网站检测方法、装置、计算机设备及存储介质在审
| 申请号: | 202111016167.3 | 申请日: | 2021-08-31 |
| 公开(公告)号: | CN113783858A | 公开(公告)日: | 2021-12-10 |
| 发明(设计)人: | 吴凯丽;杨熠;张秉彬 | 申请(专利权)人: | 上海微问家信息技术有限公司 |
| 主分类号: | H04L29/06 | 分类号: | H04L29/06;G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 成都顶峰专利事务所(普通合伙) 51224 | 代理人: | 王霞 |
| 地址: | 200000 上海市自由贸*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 非法 网站 检测 方法 装置 计算机 设备 存储 介质 | ||
本发明涉及互联网信息安全技术领域,具体涉及一种非法网站检测方法、装置、计算机设备及存储介质。方法包括提取目标网站的HTML信息及图像信息;对HTML信息进行特征字符提取,获得特征文本信息;将特征文本信息导入文本神经网络模型,输出第一概率值;在第一概率值大于设定阈值时,判定目标网站为非法网站,否则对图像信息进行图像特征提取,获得图像特征信息;将图像特征信息导入图像神经网络模型,输出第二概率值;在第二概率值大于设定阈值时,判定目标网站为非法网站,否则判定目标网站为正常网站。本发明可以对目标网站进行文本和图像两个层面的非法检测,在文本层面检测不出情况下再进行图像层面的检测,有效提高对非法网站的检测精确度。
技术领域
本发明涉及互联网信息安全技术领域,具体涉及一种非法网站检测方法、装置、计算机设备及存储介质。
背景技术
随着互联网的迅速发展,越来越多的人从网站上获取、共享、交换信息。然而,互联网上的信息不仅包含了人们需要的有用知识,同时也滋生了一些非法信息,给广大网民的身心带来危害。因此,网站安全检测显得尤为重要,对非法网站的检测对于构建健康的网络环境具有重要现实意义。网站安全检测,也称网站安全评估、网站漏洞测试、Web安全检测等。它是通过技术手段对网站进行漏洞扫描,检测网页是否存在漏洞、网页是否挂马、网页有没有被篡改、是否有欺诈网站等,提醒网站管理员及时修复和加固,保障web网站的安全运行。
随着机器学习的不断发展,机器学习技术被应用于对非法网站进行检测。目前较为常见的基于机器学习的网站分类方法为基于网页文本内容的方法,其实现机器学习时,先获取网站页面的文本内容,再进行关键字提取,放入模型进行训练,反复调优,最终实现分类。但是目前大量的非法网站其实是正常的网站被攻击后变成的非法网站,其网站文本内容可能均为正常内容,但用户实际看见的内容为图片形式的非法信息,这样就逃避了文本内容的检测。因此,现有的基于机器学习的非法网站检测方法已经不足以应对目前的网站安全检测需求,有待进一步改进。
发明内容
针对现有技术存在的不足,本发明提供了一种非法网站检测方法、装置、计算机设备及存储介质,其应用时,可以对目标网站进行文本和图像两个层面的非法检测,在文本层面检测不出情况下再进行图像层面的检测,有效提高对非法网站的检测精确度。
第一方面,本发明提供一种非法网站检测方法,包括:
获取目标网址,并根据目标网址访问目标网站;
提取目标网站的HTML信息及图像信息;
对HTML信息进行特征字符提取,获得特征文本信息;
将特征文本信息导入预置的文本神经网络模型,对特征文本信息进行非法概率判定,输出第一概率值;
在第一概率值大于设定阈值时,判定目标网站为非法网站,否则,对图像信息进行图像特征提取,获得图像特征信息;
将图像特征信息导入预置的图像神经网络模型,对图像特征信息进行非法概率判定,输出第二概率值;
在第二概率值大于设定阈值时,判定目标网站为非法网站,否则判定目标网站为正常网站。
基于上述发明内容,通过提取目标网站的HTML信息的特征文本信息,来导入相应的文本神经网络模型,可以利用文本神经网络模型进行第一层面的目标网站智能非法检测,当文本神经网络模型判定输出的第一概率值大于设定阈值时,就可以判定目标网站为非法网站,否则继续通过提取目标网站图像信息对应的图像特征信息,来导入相应的图像神经网络模型,利用图像神经网络模型进行第二层面的目标网站智能非法检测,当图像神经网络模型判定输出的第二概率值大于设定阈值时,就可以判定目标网站为非法网站,否则判定目标网站为正常网站。通过对目标网站进行文本和图像两个层面的非法检测,可以在文本层面检测不出情况下再进行图像层面的检测,有效提高对非法网站的检测精确度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海微问家信息技术有限公司,未经上海微问家信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111016167.3/2.html,转载请声明来源钻瓜专利网。





