[发明专利]基于支持向量机的垃圾邮件过滤方法无效

申请号：	200710069593.7	申请日：	2007-08-03
公开（公告）号：	CN101106539A	公开（公告）日：	2008-01-16
发明（设计）人：	陆冠中;徐从富;王金龙	申请（专利权）人：	浙江大学
主分类号：	H04L12/58	分类号：	H04L12/58;H04L29/06;G06F17/30;G06Q10/00
代理公司：	杭州求是专利事务所有限公司	代理人：	张法高
地址：	310027***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于支持向量机的垃圾邮件过滤方法，其步骤如下：1)对邮件进行解析，提取标题、文本和字符集相关信息；2)对提取的文本信息内容进行分词；3)统计邮件中的词频，利用TF－IDF公式将邮件文本映射成向量；4)利用LibSVM对邮件样本进行训练得到支持向量机模型；5)利用支持向量机模型对新的邮件进行分类，得到邮件是否为垃圾邮件的概率值；6)利用阈值调整来保证正常邮件被误判为垃圾邮件的比率维持在较低的水平，并最终判定邮件是否为垃圾邮件。本发明利用了支持向量机所具有的单模型分类准确率最高的优点，综合利用了文本特征和行为特征，提高了垃圾邮件过滤的准确率，同时，还有效解决了垃圾邮件过滤时所面临的误判代价不对等问题。
搜索关键词：	基于支持向量垃圾邮件过滤方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于支持向量机的垃圾邮件过滤方法，其步骤如下：1)对邮件进行解析，提取标题、文本和字符集相关信息；2)对提取的文本信息内容进行分词；3)统计邮件中的词频，利用TF-IDF公式将邮件文本映射成向量；4)利用LibSVM对邮件样本进行训练得到支持向量机模型；5)利用LibSVM和4)中得到的支持向量机模型对邮件进行分类，得到邮件是否为垃圾邮件的概率值；6)利用阈值调整降低正常邮件被误判为垃圾邮件的比率，并最终判定邮件是否为垃圾邮件。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江大学，未经浙江大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200710069593.7/，转载请声明来源钻瓜专利网。

上一篇：一种变频磁悬浮压缩膨胀机组
下一篇：一种实现HDLC承载信令中继的方法及中继设备

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L12-00 数据交换网络
H04L12-02 .零部件
H04L12-28 .以通路配置为特征的，例如LAN[局域网]或WAN[广域网]
H04L12-50 .电路交换系统，即系统在通信期间通路具有完全永久性
H04L12-54 .存储转发交换系统
H04L12-64 .混合交换系统

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于支持向量机的垃圾邮件过滤方法无效

专利文献下载