[发明专利]一种钓鱼网站鉴别系统和方法有效
申请号: | 201310477313.1 | 申请日: | 2013-10-12 |
公开(公告)号: | CN103530367B | 公开(公告)日: | 2017-07-18 |
发明(设计)人: | 张巍;姜青山 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙)44316 | 代理人: | 沈祖锋,郝明琴 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种钓鱼网站鉴别系统,其包括特征提取模块、特征向量降维模块、分类训练模块及鉴别模块。特征提取模块用于提取网站的页面信息及排名信息,并获得特征向量;特征向量降维模块和特征提取模块相连,用于对特征向量进行降维,获得降维后的特征向量;分类训练模块和特征向量降维模块相连,用于对已知网站的降维后的特征向量进行分类训练,获得分类模型;鉴别模块和分类训练模块及特征向量降维模块分别相连,用于保存分类模型,并利用分类模型对未知网站的降维后的特征向量进行鉴别,判断是否为钓鱼网站。所述钓鱼网站鉴别系统和所述钓鱼网站鉴别方法同时将网站排名和网站内容作为网站的特征向量,可以提高网站鉴别的精度。 | ||
搜索关键词: | 一种 钓鱼 网站 鉴别 系统 方法 | ||
【主权项】:
一种钓鱼网站鉴别系统,其特征在于,包括:特征提取模块,用于提取网站的页面信息及排名信息,并获得特征向量;特征向量降维模块,其和所述特征提取模块相连接,用于对所述特征向量进行降维,获得降维后的特征向量;分类训练模块,其和所述特征向量降维模块相连接,用于对已知网站的所述降维后的特征向量进行分类训练,获得分类模型;及鉴别模块,其和所述分类训练模块及所述特征向量降维模块分别相连接,用于保存所述分类模型,并利用所述分类模型对未知网站的所述降维后的特征向量进行鉴别,判断是否为钓鱼网站;其中,将所述特征提取模块所提取的网站内容的特征向量和网站排名信息的特征向量作为网站的特征向量进行后续处理;所述特征提取模块提取网站的页面信息时只保存中文汉字到文本中,并对所述文本进行分词及提取所述文本中的名词和动词作为一级特征词;所述分类训练模块具体采用前馈神经网络方法对已知网站的所述降维后的特征向量进行分类训练,得到所述分类模型:将已知网站的所述降维的特征向量作为训练数据通过隐含层节点作用于输出层节点,经过非线形变换,产生输出节点的输出值Yk;输出节点的输出值Yk与期望输出值tk之间的偏差,通过调整权值wi,j、Tj,k以及阈值θi、θk,使误差沿梯度方向下降,并经过反复学习训练,确定与最小误差相对应的权值和阈值,训练即停止。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310477313.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种高效搜索方法
- 下一篇:一种停车位自动锁及其控制方法