[发明专利]一种社交网络中垃圾邮件发送者的发现方法有效
申请号: | 201910125820.6 | 申请日: | 2019-02-20 |
公开(公告)号: | CN109889436B | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 李建欣;张帅;邵明来;何雨;周号益 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | H04L12/58 | 分类号: | H04L12/58;G06K9/62 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 社交 网络 垃圾邮件 发送 发现 方法 | ||
1.一种社交网络中垃圾邮件发送者的发现方法,其特征在于,包括以下步骤:步骤1,进行数据预处理,将邮件数据处理成垃圾邮件发送者发现模型所需格式;步骤2,进行用户行为特征提取,所述提取方式为利用半监督训练的图卷积网络来提取用户行为特征;步骤3,用户分类,所述分类方式为根据用户行为特征提取器输出的用户行为属性,判断每个用户节点是否为垃圾邮件发送者;步骤4,构造决策目标函数,指导垃圾邮件发送者发现模型的优化方向,使得其中的用户行为特征提取器和用户分类器能够联合学习图卷积网络中的参数和优化单类支持向量机的分类平面;步骤5,训练社交网络中垃圾邮件发送者发现模型;
在所述步骤1中,所述垃圾邮件发送者发现模型由步骤2-5具体实现,具体的,使用步骤5所述训练方法,按照步骤4所述目标函数,对步骤2和步骤3所述中的神经网络进行训练优化;在所述步骤1中,所述垃圾邮件发送者发现模型中所有用户节点组成一个网络,每个用户节点拥有自身的属性,用户节点之间通过用户之间的发送、回复、转发以及举报关系结构化表示成一张网络,网络中有N个用户,全体用户表示为X={X1,…,XN},其中每个Xi为C维的向量,代表每个用户的C个自身属性,用户之间的关系表示为邻接矩阵A和一个度矩阵Dii=∑jAij,所述i,j,C,N为正整数,其中i、j表示用户的编号,Aij为邻接矩阵的第i行、第j列,用来表示用户i和用户j之间有无发送、回复、转发或举报关系;Dii表示度矩阵的对角线上的第i个元素,用来表示用户i与所有其他用户之间共有多少条发送、回复、转发或举报关系;
步骤5,所述训练的方式为使用梯度下降方法优化图卷积网络中的参数W,训练直到网络收敛到一个局部最优点,由于图卷积网络的参数W、单类支持向量机的参数ω和单类支持向量机的参数ρ不在同一个规模上,采用交替训练的方式训练三个参数W,ω和ρ:先固定参数ρ,使用梯度下降方法训练图卷积网络的参数W、单类支持向量机的参数ω共k步(k∈N);然后,在每k步之后,由当前训练过的图卷积网络输出的用户行为特征表示,使用线搜索的方式求解出最优参数ρ;反复迭代上述过程直到模型收敛,N为正整数。
2.如权利要求1所述的方法,其特征在于,在所述步骤2中,所述利用半监督训练的图卷积网络来提取用户行为特征的具体方式为,对原始输入的网络中的每个用户节点提取并融合其本身特征和其与其他用户之间的发送、回复、转发以及举报关系,通过一个L层的图卷积网络提取每个用户节点的行为属性,所述L为正整数,输入数据经过第l层图卷积网络之后的形式记做H(l),则每层图卷积网络的形式为:
其中W(l)为第l层图卷积网络中的可训练参数矩阵,其中A为邻接矩阵标识用户之间的关系,所述D为度矩阵,Dij代表度矩阵D中的第i行第j列上的值,IN为N阶单位矩阵,N为网络中的用户个数,为度矩阵,σ为线性整流函数。
3.如权利要求2所述的方法,其特征在于,在所述步骤3中,所述判断每个用户节点是否为垃圾邮件发送者的具体方式为,在接收用户行为属性特征后,单类支持向量机根据训练好的参数ω和ρ计算所得到一个紧凑的正常用户的分类边界,超出所述分类边界就认为是垃圾邮件发送者,在所述分类边界之内就认为是正常用户。
4.如权利要求3所述的方法,其特征在于,在所述步骤4中,对于训练数据X={X1,…,XN},垃圾邮件发送者发现模型的决策目标为:
其中ω为可训练的单类支持向量机的超平面,用于限制超平面与原点之间的距离,ρ为可训练的超平面的偏置,其中W(l)为训练的第l层图卷积网络的参数,第三项是惩罚项,用于惩罚在分类边界之外的点;超参数v∈(0,1]用于权衡允许有多少比例的点落在分类边界之外;最后一项是对图卷积网络参数W的权重衰减正则化项,用于限制参数W的大小,防止参数过拟合,所述λ为正则化超参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910125820.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于动态视频海报的社交方法、系统、装置及存储介质
- 下一篇:一种新型拍照软件