[发明专利]一种垃圾电子邮件意图识别系统有效
申请号: | 201410187923.2 | 申请日: | 2014-05-06 |
公开(公告)号: | CN103944810B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 李绍滋;郭锋;曹冬林 | 申请(专利权)人: | 厦门大学 |
主分类号: | H04L12/58 | 分类号: | H04L12/58;H04L29/06 |
代理公司: | 厦门市首创君合专利事务所有限公司35204 | 代理人: | 张松亭 |
地址: | 361000 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种垃圾电子邮件意图识别系统,包括意图抽取单元、意图判断及意图库维护单元,和意图库。本发明的一种垃圾电子邮件意图识别系统通过抽取电子邮件的显式URL地址、隐式URL地址、显示邮箱地址、隐式邮箱地址、QQ号码、银行账号、信用卡号、电话号码和公司名称等多种类型的意图,并在预先创建的意图库中对每个意图进行查询,之后将当前电子邮件的所有意图查询结果整合在一起进行综合分析判断,从而能够判断出当前电子邮件是否为垃圾邮件。本发明无需一一进入邮件正文中的超链接,并分析所链接的文本的意图,只需利用所述意图库即可高效地完成对电子邮件的意图分析和邮件属性判断,且所抽取的意图种类更多,意图分析结果更准确。 | ||
搜索关键词: | 一种 垃圾 电子邮件 意图 识别 系统 | ||
【主权项】:
一种垃圾电子邮件意图识别系统,其特征在于,包括意图抽取单元、意图判断及意图库维护单元,和由所述意图判断及意图库维护单元创建的意图库;所述意图抽取单元接收来自上级单元的电子邮件全文和包括意图分析命令或反馈学习命令的操作指令;若所述操作指令为意图分析命令,则所述意图抽取单元抽取该电子邮件中指定类型的意图、形成意图串,并将该意图串连同该操作指令一起传送给所述意图判断及意图库维护单元,之后接收来自意图判断及意图库维护单元的邮件属性判断结果,并将该判断结果反馈给上级单元;若所述操作指令为反馈学习命令,则所述意图抽取单元抽取该电子邮件中指定类型的意图、形成意图串,并抽取该电子邮件中预先标记的邮件属性,之后将该意图串、该邮件属性连同该操作指令一起传送给所述意图判断及意图库维护单元;所述意图判断及意图库维护单元接收来自意图抽取单元的意图串和意图分析命令,或意图串、邮件属性和反馈学习命令;若所述意图判断及意图库维护单元接收到意图分析命令,则通过对接收到的意图串中的所有意图在所述意图库中进行查询而分析判断出邮件属性,并向所述意图抽取单元反馈邮件属性判断结果;若所述意图判断及意图库维护单元接收到反馈学习命令,则基于接收到的意图串和邮件属性进行反馈学习并更新意图库;所述意图判断及意图库维护单元还包括在预置的时间间隔内自动维护意图库;所述指定类型的意图包括显式URL地址、隐式URL地址、显示邮箱地址、隐式邮箱地址、QQ号码、银行账号、信用卡号、电话号码和公司名称;所述邮件属性包括垃圾邮件、正常邮件和未知邮件三种属性;所述意图库中存有意图文件,每个意图文件包括意图内容、意图种类、总频数、ham频数、spam频数、总文档数、ham文档数、spam文档数、生命值、ham%、spam%和特征向量;所述总频数为对应的意图内容在所述意图识别系统之前处理过的所有邮件中出现的次数,所述ham频数为对应的意图内容在所述意图识别系统之前处理过的正常邮件中出现的次数,所述spam频数为对应的意图内容在所述意图识别系统之前处理过的垃圾邮件中出现的次数,所述总文档数为所述意图识别系统之前处理过的所有邮件中存在对应的意图内容的邮件数,所述ham文档数为所述意图识别系统之前处理过的所有邮件中存在对应的意图内容的正常邮件数,所述spam文档数为所述意图识别系统之前处理过的所有邮件中存在对应的意图内容的垃圾邮件数,所述ham%为ham频数/总频数,所述spam%为spam频数/总频数,所述特征向量用于区分各个意图文件。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410187923.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种轴向径向电励磁磁轴承
- 下一篇:一种轴承对及轴承对组件