[发明专利]一种基于网络映射的社交网络中异常用户检测方法有效
申请号: | 201710541257.1 | 申请日: | 2017-07-05 |
公开(公告)号: | CN107835113B | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 郑子彬;叶方华;周育人 | 申请(专利权)人: | 中山大学 |
主分类号: | H04L12/58 | 分类号: | H04L12/58 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 杨晓松 |
地址: | 510275 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 映射 社交 异常 用户 检测 方法 | ||
本发明涉及一种基于网络映射的社交网络中异常用户检测方法,包括以下步骤:S1、利用网络爬虫技术爬取社交网络平台的用户数据;S2、对爬取到的用户数据进行预处理,构建用户社交关系网络图G;S3、基于用户社交关系网络图G,利用node2vec将用户的社交关系转化为低维的向量表征;S4、融合用户多维度的向量表征得到最终的向量表征;S5、基于用户的特征向量进行聚类,预测用户是正常用户,还是异常用户,如果是异常用户,并给出异常类型。本发明具有时间和人力成本开销低、能够识别各种各样的异常用户类型并且能够识别新的异常用户类型、能够综合考虑用户多维度的属性特征、准确率高等优点。
技术领域
本发明涉及网络数据检测的技术领域,尤其涉及到一种基于网络映射的社交网络中异常用户检测方法。
背景技术
社交网络的便利性、娱乐性、实时性等一系列优良特性吸引了海量的用户,在网络空间中构筑起一个虚拟的社会。同时,社交网络庞大的用户基数吸引了大量的攻击者。攻击者通过创建大量的虚假账号和盗用正常的账户,在社交网络中或散发谣言,或发布广告、钓鱼、色情信息等,或通过这些账号来恶意增加其他账号的信誉,如批量关注、恶意点赞等。这些攻击者统称为异常用户。因此,社交网络中的异常用户检测对个人、企业和国家均具有十分重要的意义。
目前,学术界和工业界提出了大量的检测社交网络中异常用户的方法。这些方法可以被归为四类:基于行为特征的检测方法,基于内容的检测方法,基于图的检测方法,以及基于无监督学习的检测方法。基于行为特征的检测方法将异常用户检测视为一个二分类问题,利用用户的行为特征来区分正常用户和异常用户。基于内容的检测方法与基于行为特征的检测方法类似,其主要利用的是用户发布的内容信息,这些信息反映了用户的兴趣爱好。基于图的检测方法是利用正常用户和异常用户在所形成的社交网络中具有不同的结构性质,将异常用户检测问题转化为网络中的异常节点检测问题,然后利用图挖掘的相关算法来识别出异常用户。基于无监督学习的方法是利用正常用户有相同或者相似的特征,通过特征的聚类来区分正常用户和异常用户。尽管这些检测方法已经被广泛运用到实践当中,但是这些方法只有在特定的应用场景下才能取得良好的效果,泛化能力不强,不具有普适性,因而不能很好的满足实际需要。具体来讲,基于行为特征和基于内容的检测方法虽然准确率较高,但由于是有监督学习方法,需要提前对样本数据进行标记,这需要花费大量的时间和人力成本,而且只能检测已知的异常类型,当异常用户改变其表现形态后就无法准确检测。基于图的检测方法虽然有较强的鲁棒性,但是准确率较低,而且只能检测与其他用户有联系的异常用户,目前尚处于理论研究阶段。基于无监督学习的方法不需要提前对样本数据进行标记,节省了时间和人力成本开销,因而能够较快形成检测系统并且可以检测未知的攻击行为,但是其不容易区分不同类型的异常用户。
鉴于社交网络中海量的用户基数、异常用户的多种表现形态和动态特征,以及已有的办法的缺陷,亟待提出一种时间和人力成本开销低、能够识别各种各样的异常用户类型并且能够识别新的异常用户类型、能够综合考虑用户多维度的属性特征、准确率高的检测方法。
发明内容
本发明的目的在于克服现有技术的不足,提供一种时间和人力成本开销低、能够识别各种各样的异常用户类型并且能够识别新的异常用户类型、能够综合考虑用户多维度的属性特征、准确率高的基于网络映射的社交网络中异常用户检测方法。
为实现上述目的,本发明所提供的技术方案为:其包括以下步骤:
S1、利用网络爬虫技术爬取如腾讯QQ、微信、新浪微博、Facebook等社交网络平台的用户数据。
S2、对爬取到的用户数据进行预处理,构建用户社交关系网络图G;预处理步骤如下:
S21、将爬取到的用户数据分为四个维度,分别为用户基本信息、用户行为特征、用户兴趣爱好以及用户好友关系;
S22、将步骤S21中所述用户基本信息、用户行为特征、用户兴趣爱好该三个维度的用户数据分别对应处理成三个含有多维的特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710541257.1/2.html,转载请声明来源钻瓜专利网。