[发明专利]恶意论坛的识别方法及装置在审
申请号: | 201310368712.4 | 申请日: | 2013-08-22 |
公开(公告)号: | CN103475642A | 公开(公告)日: | 2013-12-25 |
发明(设计)人: | 朱珊珊;林英杰 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06F17/30 |
代理公司: | 北京智汇东方知识产权代理事务所(普通合伙) 11391 | 代理人: | 康正德;薛峰 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 恶意 论坛 识别 方法 装置 | ||
技术领域
本发明涉及互联网领域,特别是涉及一种恶意论坛的识别方法及装置。
背景技术
恶意论坛是指故意在计算机系统上执行恶意任务的病毒、蠕虫和特洛伊木马等的非法论坛。这类论坛通常都有一个共同特点,他们通常情况下是以某种页面形式让人们正常浏览页面内容,同时非法获取用户计算机中的各种数据。现如今,恶意论坛严重地影响用户的网络环境,所以,对恶意论坛的识别也已经成为保证网络安全的重要工作之一,目前,通常采用如下两种技术对恶意论坛进行识别。
第一种,在防火墙的内存中存储有恶意论坛的IP(Internet Protocol,网络之间互连的协议)地址以及符合该IP地址的所有URL(Uniform Resource Locator,统一资源定位符)的对应关系。当获取到用户访问某论坛的URL请求时,还要获取该论坛的IP地址,根据该论坛的IP地址在防火墙内存中查找该IP地址对应的所有URL,并将论坛URL与防火墙内存中该IP地址对应的所有URL进行对比,对比成功则说明该论坛为恶意论坛。
第二种,将用户想要访问的论坛的URL与恶意关键词列表页匹配,在匹配结果中选取基准关键字,并对这组关键字进行顺序标号标识,若该组关键字的顺序号标识数目与保存的恶意关键词表中的该组关键字的顺序号标识数目一致,则说明该论坛为恶意论坛。
上述两种技术均为基于URL对比的方式,这就需要预先获取到恶意论坛的URL并存储,因此仅能够对已知的恶意论坛进行识别和过滤,对未知的恶意论坛无法进行识别和处理。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的恶意论坛的识别方法及装置。
本发明提供了一种恶意论坛的识别方法,包括:
获取待访问论坛的论坛名称和论坛的版块名称;
将论坛名称和版块名称分别与预存关键词库中的恶意关键词进行匹配;
若匹配成功,则识别论坛为恶意论坛。
进一步地,在识别论坛为恶意论坛之后,还包括:
收集所有已知恶意论坛的论坛名称和版块名称并进行处理,得到论坛名称列表和版块名称列表;
对论坛名称列表和版块名称列表进行热点聚合,得到新恶意关键词,将新恶意关键词添加到关键词库中。
进一步地,对论坛名称列表和版块名称列表进行热点聚合,得到新恶意关键词,包括:
根据最长公共子序列LCS算法,生成与论坛名称列表和版块名称列表各自对应的热点词表;
根据词语出现频率在各个热点词表中选择热点关键词;
将获取的各个热点关键词进行合并,作为新恶意关键词。
进一步地,各个热点词表的生成方式包括:
对于论坛名称列表和版块名称列表而言,
采用最长公共子序列LCS算法对其中包含的每两个词进行匹配;
获取每两个词之间的最长公共子序列,作为热点关键词;
将获取的所有热点关键词进行组合,得到与其对应的热点词表。
进一步地,根据词语出现频率在各个热点词表中选择热点关键词,包括:
根据预设规则分别对各个热点词表中的热点关键词进行筛选;
在筛选后的各个热点词表中选择出现频率由高到低的预设个数热点关键词。
进一步地,根据预设规则分别对各个热点词表中的热点关键词进行筛选,包括:
对各个热点词表进行常用语去除处理,其中,常用语为使用频率超过预设次数的词语;
判断处理后的各个热点词表中的热点关键词所对应的论坛是否为恶意论坛;
若是,保留该关键词;
若否,去除该关键词。
进一步地,收集所有已知恶意论坛的论坛名称和版块名称并进行处理,包括:
收集所有已知恶意论坛的论坛名称和版块名称并存入各自对应的预处理库;
对各个预处理库中、来自同一网络之间互连协议IP地址的名称进行消重处理。
进一步地,对论坛名称列表和版块名称列表进行热点聚合,包括:
每隔预设时间对论坛名称列表和版块名称列表进行热点聚合。
进一步地,恶意关键词包括论坛名称关键词和版块名称关键词;
将论坛名称以及版块名称分别与预存关键词库中的恶意关键词进行匹配,包括:
将论坛名称与论坛名称关键词匹配,将版块名称与版块名称关键词匹配;
当论坛名称与论坛名称关键词匹配,且版块名称与版块名称关键词匹配时,则确认匹配成功;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310368712.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:恶意程序检测方法
- 下一篇:一种用于发送消息的方法及装置