[发明专利]一种垃圾邮件的识别方法、装置以及电子设备有效
申请号: | 201710085329.6 | 申请日: | 2017-02-17 |
公开(公告)号: | CN108462624B | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 沈朝阳 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04L12/58 | 分类号: | H04L12/58 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种垃圾邮件的识别方法,包括:提取待识别邮件的正文并进行分词,获得所述待识别邮件的词条集;结合预先获得的基准词频表识别所述词条集当中的噪音字符,并计算所述词条集当中的噪音字符占比;判断所述噪音字符占比是否大于预设噪音字符占比阈值,若是,将所述待识别邮件识别为垃圾邮件。所述垃圾邮件的识别方法,根据噪音字符的特性识别待识别邮件当中的噪音字符,并进一步根据待识别邮件当中包含的噪音字符来识别待识别邮件是否为垃圾邮件,实现方式简单,识别垃圾邮件的准确率更高。 | ||
搜索关键词: | 一种 垃圾邮件 识别 方法 装置 以及 电子设备 | ||
【主权项】:
1.一种垃圾邮件的识别方法,其特征在于,包括:提取待识别邮件的正文并进行分词,获得所述待识别邮件的词条集;结合预先获得的基准词频表识别所述词条集当中的噪音字符,并计算所述词条集当中的噪音字符占比;判断所述噪音字符占比是否大于预设噪音字符占比阈值,若是,将所述待识别邮件识别为垃圾邮件。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710085329.6/,转载请声明来源钻瓜专利网。