[发明专利]恶意网址数据库的建立方法、恶意网址的识别方法和装置有效
申请号: | 201210069443.7 | 申请日: | 2012-03-15 |
公开(公告)号: | CN102663000A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 梁知音 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F21/00 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何青瓦;李庆波 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 恶意 网址 数据库 建立 方法 识别 装置 | ||
1.一种恶意网址数据库的建立方法,其特征在于,该方法包括:
S1、预先将各网站域名与对应的站点属性信息进行关联,构建站点信息关联数据库;
S2、预先构建反链关联数据库,保存各url之间的链接关系;
S3、获取已知恶意网址的url,添加到待检测队列中,逐个从待检测队列中取出url并对取出的当前url分别执行步骤S4,直至待检测队列为空,并利用所有添加到待检测队列中的url或网站域名构建恶意网址数据库;
S4、查询所述反链关联数据库,确定当前url的所有反链url,将与已知恶意网址的url之间的关联程度满足预设要求的反链url添加到待检测队列中;或者,
解析当前url的站点属性信息,查询所述站点信息关联数据库,确定与当前url具有相同站点属性信息的网站域名,将与已知恶意网址的url之间的关联程度满足预设要求的网站域名添加到待检测队列中。
2.根据权利要求1所述的方法,其特征在于,所述站点属性信息包括以下所列的至少一种:网站名,网站所有人,网站所有人联络信息,公司信息,IP地址信息,ICP信息。
3.根据权利要求1所述的方法,其特征在于,在所述步骤S3中还包括:为所述恶意网址的url赋予初始权值,为存在反链关系的各url之间设定反链因子,针对网站域名之间共有的站点属性信息的类型设定影响因子,所述反链因子和影响因子的取值范围为区间(0,1);
反链url与已知恶意网址的url之间关联程度的计算包括:将当前url的权值乘以反链因子,得到反链url的权值;
网站域名与已知恶意网址的url之间关联程度的计算包括:将当前url的权值乘以网站域名与当前url所共有站点属性信息的类型对应的影响因子,得到网站域名的权值;
所述关联程度满足预设要求为:所述反链url或网站域名的权值超过预设阈值。
4.根据权利要求3所述的方法,其特征在于,所述恶意网址数据库还包括:所有添加到待检测队列中的url或网站域名对应的站点属性信息和权值。
5.一种恶意网址的识别方法,其特征在于,该方法包括:
获取待检测url,查询恶意网址数据库中是否包含所述待检测url,如果是,则确定所述待检测url为恶意网址;
其中所述恶意网址数据库是采用如权利要求1至4任一权项所述的方法建立的。
6.一种恶意网址的识别方法,其特征在于,该方法包括:
S201、获取待检测url,解析该url的站点属性信息;
S202、利用解析得到的站点属性信息,在恶意网址数据库中查找与所述待检测url具有相同属性信息的恶意网址,所述恶意网址数据库是采用如权利要求4所述的方法建立的;
S203、利用查找到的恶意网址的权值计算待检测url的权值;
S204、判断所述待检测url的权值是否超过预设阈值,如果是,则将所述待检测url识别为恶意url。
7.根据权利要求6所述的方法,其特征在于,所述步骤S203具体为:
将步骤S202查找到的恶意网址的权值进行合并计算,得到所述待检测url的权值。
8.根据权利要求7所述的方法,其特征在于,所述合并计算是取最大值,或者取平均值,或者求和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210069443.7/1.html,转载请声明来源钻瓜专利网。