[发明专利]一种基于用户反馈的垃圾邮件检测方法无效

专利信息
申请号: 201210290542.8 申请日: 2012-08-16
公开(公告)号: CN103595614A 公开(公告)日: 2014-02-19
发明(设计)人: 李朋飞;崔可想;耿振民;杨磊;戴伟强 申请(专利权)人: 无锡华御信息技术有限公司
主分类号: H04L12/58 分类号: H04L12/58;H04L12/26;H04L29/06
代理公司: 暂无信息 代理人: 暂无信息
地址: 214081 江苏省无锡市滨*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出了一种基于用户反馈的垃圾邮件检测方法,该方法首先收集用户反馈信息,用来更新垃圾邮件数据库;然后提取邮件的发件人邮箱号,判断该邮箱号或者它所在邮箱服务器的可信度是否小于某一阈值,若是,则认为该邮件为垃圾邮件;否则,提取邮件内容的签名;通过与数据库中已知垃圾邮件计算汉明距离,若距离小于某一阈值,则认为该邮件为垃圾邮件;否则,认为该邮件为正常邮件;它包括收集用户反馈信息、读取邮件、判断发件人邮箱号是否为垃圾制造者、获取邮件内容签名、检测邮件内容是否为垃圾邮件等步骤。本发明可提高垃圾邮件的识别范围和准确度,具有识别范围广、准确度高、自学习能力强等特点。
搜索关键词: 一种 基于 用户 反馈 垃圾邮件 检测 方法
【主权项】:
一种基于用户反馈的垃圾邮件检测方法,其特征在于,该方法包括如下步骤:S1、收集用户反馈信息,更新垃圾邮件数据库;S2、接收邮件:接收全部的邮件数据,分别对每一封邮件处理,转向步骤S3;S3、获取发件人邮箱号及所属邮箱服务器,并根据数据库中可信度判断是否为垃圾邮件制造者:根据邮箱服务器预先设定好的可信度阈值θ,若是可信度小于θ,则转向步骤S6;若否,则转向步骤S4,所述可信度阈值θ一般取0.2~0.8;S4、获取邮件内容的签名:根据邮件内容的文本特征集,采用SIMHASH算法生成该邮件的签名;所述SIMHASH算法的计算公式为:S=SIMHASH(MAIL_TEXT),其中SIMHASH表示SIMHASH算法,MAIL‑TEXT表示邮件内容中的文本特征集和权重信息,S为输出的64位的邮件签名;S5、检测邮件内容是否为垃圾邮件:根据步骤S4得到的邮件内容签名S,通过与数据库中已知垃圾邮件计算汉明距离,当签名差距小于预先设定好的某一阈值μ时,则认为当前邮件与已知垃圾邮件相似,从而断定其为垃圾邮件;否则,认为当前邮件为正常邮件,所述μ一般取3;S6、处理邮件:根据前面步骤的判断,如果当前邮件为垃圾邮件,则根据收件人预先设定好的策略进行处理;如果为正常邮件,则将其放入收件箱未读邮件中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡华御信息技术有限公司,未经无锡华御信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201210290542.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top