[发明专利]垃圾邮件过滤方法及装置有效
申请号: | 201110264365.1 | 申请日: | 2011-09-08 |
公开(公告)号: | CN103001848A | 公开(公告)日: | 2013-03-27 |
发明(设计)人: | 郭涛;于洪涌;薛立宏;丘凌;张国威 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | H04L12/58 | 分类号: | H04L12/58;G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 颜镝 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 垃圾邮件 过滤 方法 装置 | ||
1.一种垃圾邮件过滤方法,包括:
在接收到电子邮件时,扫描所述电子邮件的内容中是否存在命中预设的模糊词和情境识别库中条目的模糊词;
如果存在命中条目,则对所述电子邮件进行情境分析,并根据所述电子邮件对应的情境调整得到所述电子邮件的邮件值向量;
根据调整后得到的所述电子邮件的邮件值向量计算垃圾邮件概率,并将所述垃圾邮件概率与预设阈值进行比较,以判断所述电子邮件是否为可疑垃圾邮件,并对确定为可疑垃圾邮件的电子邮件进行拦截处理。
2.根据权利要求1所述的垃圾邮件过滤方法,其中在接收电子邮件之前,还包括建立模糊词和情境识别库的操作,具体包括:
建立所述模糊词和情境识别库;
根据已有垃圾关键字与模糊词之间的对应关系在所述模糊词和情境识别库中添加条目;
根据反垃圾邮件系统中的历史数据计算所述已有垃圾关键字与模糊词之间的对应关系所对应的参考邮件值向量,所述参考邮件值向量包括参考关键字分值、参考替换分值、参考情境分值和参考干扰符分值;
在条目中添加多种情境下对所述已有垃圾关键字与模糊词之间的对应关系的影响概率,所述情境包括至少一个情境元素。
3.根据权利要求2所述的垃圾邮件过滤方法,其中所述对电子邮件进行情境分析的操作具体包括:
分析获得所述电子邮件的情境元素;
将获得的所述电子邮件的情境元素与命中条目中的各种情境所包括的情境元素进行匹配,确定所述电子邮件对应的情境。
4.根据权利要求3所述的垃圾邮件过滤方法,其中根据所述电子邮件对应的情境调整得到所述电子邮件的邮件值向量的操作具体包括:
根据情境分析确定的所述电子邮件对应的情境查询对应的影响概率;
通过所述影响概率对所述命中条目对应的参考邮件值向量进行调整,得到所述电子邮件的邮件值向量,所述电子邮件的邮件值向量包括关键字分值、替换分值、情境分值和干扰符分值。
5.根据权利要求4所述的垃圾邮件过滤方法,其中所述根据调整后得到的所述电子邮件的邮件值向量计算垃圾邮件概率的操作具体为:
将所述电子邮件的邮件值向量中的关键字分值和替换分值的乘积与情境分值及干扰符分值进行累加,得到所述电子邮件对应的垃圾邮件概率。
6.根据权利要求1~5任一所述的垃圾邮件过滤方法,其中在扫描所述电子邮件的内容中是否存在命中预设的模糊词和情境识别库中条目的模糊词之前,还包括:
对所述电子邮件中的非语言部分进行干扰符去除处理。
7.根据权利要求6所述的垃圾邮件过滤方法,其中在判断所述电子邮件为可疑垃圾邮件,并进行拦截处理之后,还根据本次判断结果结合历史数据重新计算所述已有垃圾关键字与模糊词之间的对应关系所对应的参考邮件值向量和情境对应的影响概率,并更新所述模糊词和情境识别库中对应条目。
8.根据权利要求1所述的垃圾邮件过滤方法,其中如果存在多个命中条目,则分别对每个命中条目进行模糊词处理,计算垃圾邮件概率以及阈值比较,并综合各个命中条目所得到的结论进行所述电子邮件是否为可疑垃圾邮件的判断。
9.一种垃圾邮件过滤装置,包括:
电子邮件接收单元,用于接收电子邮件;
模糊词扫描单元,用于扫描所述电子邮件的内容中是否存在命中预设的模糊词和情境识别库中条目的模糊词;
情境分析单元,用于在存在命中条目时,对所述电子邮件进行情境分析;
向量调整单元,用于根据所述电子邮件对应的情境调整得到所述电子邮件的邮件值向量;
概率计算单元,用于根据调整后得到的所述电子邮件的邮件值向量计算垃圾邮件概率;
阈值比较单元,用于将所述垃圾邮件概率与预设阈值进行比较,以判断所述电子邮件是否为可疑垃圾邮件;
邮件处理单元,用于对确定为可疑垃圾邮件的电子邮件进行拦截处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110264365.1/1.html,转载请声明来源钻瓜专利网。