[发明专利]一种社交网络中垃圾邮件发送者的发现方法有效
申请号: | 201910125820.6 | 申请日: | 2019-02-20 |
公开(公告)号: | CN109889436B | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 李建欣;张帅;邵明来;何雨;周号益 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | H04L12/58 | 分类号: | H04L12/58;G06K9/62 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 社交 网络 垃圾邮件 发送 发现 方法 | ||
本发明提出一种社交网络中垃圾邮件发送者的发现方法,包括以下步骤:步骤1,进行数据预处理,将邮件数据处理成本发明中垃圾邮件发送者发现模型所需格式;步骤2,进行用户行为特征提取,所述提取方式为利用半监督训练的图卷积网络来提取用户行为特征;步骤3,用户分类,所述分类方式为根据用户行为特征提取器输出的用户行为属性,判断每个用户节点是否为垃圾邮件发送者;步骤4,构造决策目标函数,指导垃圾邮件发送者发现模型的优化方向,使得其中的用户行为特征提取器和用户分类器能够联合学习图卷积网络中的参数和优化单类支持向量机的分类平面;步骤5,训练社交网络中垃圾邮件发送者发现模型。
技术领域
本发明设计一种智能检测方法,主要涉及到一种社交网络中垃圾邮件发送者的发现方法。
背景技术
21世纪以来,伴随着信息技术的蓬勃发展,互联网的使用大范围迅速普及,人们越来越多的使用电子邮件进行生活、工作或者业务上的交流,电子邮件极大的方便了人们之间的沟通效率。然而电子邮件作为网络交流沟通的重要渠道不仅方便了正常用户,同时也更加方便了那些垃圾广告投放者。尤其是近年来,垃圾邮件烦恼着大多数人,调查数据显示,93%的被调查者都对他们接收到的大量垃圾邮件非常不满。
随着互联网的不断发展垃圾邮件迅速增长,现在人们每天收到的垃圾邮件铺天盖地。最初,垃圾邮件主要是一些不请自来的商业宣传电子邮件,而更多的有关色情、政治的垃圾邮件不断增加,甚至达到了总垃圾邮件量的40%左右,并且仍然有持续增长的趋势。最严重的是,垃圾邮件不仅骚扰用户,更经常通过附件或恶意链接来散播恶意软件。垃圾邮件对社交用户、社会安全、经济发展的危害十分巨大。从而及时发现、检测垃圾邮件甚至垃圾邮件发送者是一项十分必要的工作。
近年来,很多反垃圾邮件的措施都被提出出来,但是只有非常少的被实施了。不幸的是,这些解决办法也都还不能完全阻止垃圾邮件,而且还对正常的邮件来往产生影响。当前,现有技术主要通过来源分析、趋势分析、内容过滤、主题分析及过滤等技术来实现垃圾邮件的检测及过滤。然而,现有的这些方法在使用过程中容易将正常的邮件往来隔离,或者不能很有效地阻止垃圾邮件。
发明内容
为了解决上述问题,本发明针对垃圾邮件发送者与正常用户具有不同行为的特点,在整个邮件网络的视角下建模并且分析、提取每个用户的行为特征;进而使用这些特征来判断该用户是否为垃圾邮件发送者。
本发明包括以下步骤:步骤1,进行数据预处理,将邮件数据处理成本发明中垃圾邮件发送者发现模型所需格式;步骤2,利用半监督训练的图卷积网络来提取用户行为特征,利用半监督训练的图卷积网络来提取用户行为特征,所述提取过程为用户行为特征提取器作为系统的中间层模块,对原始输入的网络中的每个用户节点提取并融合其本身特征和其与其他用户之间的发送、回复、转发以及举报等关系,通过一个图卷积网络(GCN)提取每个用户节点的行为属性;步骤3,接收用户行为特征提取器输出的用户行为属性,判断每个用户节点是否为垃圾邮件发送者;步骤4,构造决策目标函数,指导垃圾邮件发送者发现模型的优化方向,使得其中的用户行为特征提取器和用户分类器能够联合学习图卷积网络中的参数和优化单类支持向量机的分类平面;步骤5,训练社交网络中垃圾邮件发送者发现模型。
该方法具有以下优势:在网络上应用深度学习技术,从用户自身属性和用户之间的发送、回复、转发以及举报等关系出发,构建用户的行为特征;采用半监督学习技术,只要求网络中的一少部分数据有标签即可,在现实网络中有较高的应用可行性,极大的节省了数据标注的时间和费用开销;应用了单类支持向量机(One-class SVM)技术,与深度学习技术相结合,使得模型在样本分布不均衡的情况下(绝大部分用户为正常,少部分为垃圾邮件发送者)也能有很好的检测效果;算法多参数可调,系统具有反馈操作,可根据需求设置,算法可移植性好。
附图说明
图1为本发明进行图数据处理的整体流程图;
图2为本发明的用户节点关系结构化图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910125820.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于动态视频海报的社交方法、系统、装置及存储介质
- 下一篇:一种新型拍照软件