[发明专利]一种基于用户反馈的垃圾邮件检测方法无效
申请号: | 201210290542.8 | 申请日: | 2012-08-16 |
公开(公告)号: | CN103595614A | 公开(公告)日: | 2014-02-19 |
发明(设计)人: | 李朋飞;崔可想;耿振民;杨磊;戴伟强 | 申请(专利权)人: | 无锡华御信息技术有限公司 |
主分类号: | H04L12/58 | 分类号: | H04L12/58;H04L12/26;H04L29/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 214081 江苏省无锡市滨*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于用户反馈的垃圾邮件检测方法,该方法首先收集用户反馈信息,用来更新垃圾邮件数据库;然后提取邮件的发件人邮箱号,判断该邮箱号或者它所在邮箱服务器的可信度是否小于某一阈值,若是,则认为该邮件为垃圾邮件;否则,提取邮件内容的签名;通过与数据库中已知垃圾邮件计算汉明距离,若距离小于某一阈值,则认为该邮件为垃圾邮件;否则,认为该邮件为正常邮件;它包括收集用户反馈信息、读取邮件、判断发件人邮箱号是否为垃圾制造者、获取邮件内容签名、检测邮件内容是否为垃圾邮件等步骤。本发明可提高垃圾邮件的识别范围和准确度,具有识别范围广、准确度高、自学习能力强等特点。 | ||
搜索关键词: | 一种 基于 用户 反馈 垃圾邮件 检测 方法 | ||
【主权项】:
一种基于用户反馈的垃圾邮件检测方法,其特征在于,该方法包括如下步骤:S1、收集用户反馈信息,更新垃圾邮件数据库;S2、接收邮件:接收全部的邮件数据,分别对每一封邮件处理,转向步骤S3;S3、获取发件人邮箱号及所属邮箱服务器,并根据数据库中可信度判断是否为垃圾邮件制造者:根据邮箱服务器预先设定好的可信度阈值θ,若是可信度小于θ,则转向步骤S6;若否,则转向步骤S4,所述可信度阈值θ一般取0.2~0.8;S4、获取邮件内容的签名:根据邮件内容的文本特征集,采用SIMHASH算法生成该邮件的签名;所述SIMHASH算法的计算公式为:S=SIMHASH(MAIL_TEXT),其中SIMHASH表示SIMHASH算法,MAIL‑TEXT表示邮件内容中的文本特征集和权重信息,S为输出的64位的邮件签名;S5、检测邮件内容是否为垃圾邮件:根据步骤S4得到的邮件内容签名S,通过与数据库中已知垃圾邮件计算汉明距离,当签名差距小于预先设定好的某一阈值μ时,则认为当前邮件与已知垃圾邮件相似,从而断定其为垃圾邮件;否则,认为当前邮件为正常邮件,所述μ一般取3;S6、处理邮件:根据前面步骤的判断,如果当前邮件为垃圾邮件,则根据收件人预先设定好的策略进行处理;如果为正常邮件,则将其放入收件箱未读邮件中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡华御信息技术有限公司,未经无锡华御信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210290542.8/,转载请声明来源钻瓜专利网。