[发明专利]基于关系图的微博僵尸用户检测方法有效

专利信息
申请号: 201310396404.2 申请日: 2013-09-03
公开(公告)号: CN103457799A 公开(公告)日: 2013-12-18
发明(设计)人: 邹福泰;姚雨石;吴嘉玮 申请(专利权)人: 上海交通大学
主分类号: H04L12/26 分类号: H04L12/26;H04L29/06;H04L29/08
代理公司: 上海旭诚知识产权代理有限公司 31220 代理人: 郑立
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 关系 僵尸 用户 检测 方法
【说明书】:

技术领域

发明涉及一种微博僵尸用户检测方法,尤其涉及一种基于关系图的微博僵尸用户检测方法。

背景技术

当今科技时代,随着智能通信终端的流行,移动互联网也日益走进人们的日常生活中。当前,社交网络是移动互联网中相当热门的应用,如国外的“Facebook”和“Twitter”等,在中国,在线社交网络也已渐渐成为一个主要的平台,比较熟知和常用的是微博,人们在网络上通过微博搜集信息,结交志同道合的人。微博,即微博客(MicroBlog)的简称,是一种可以即时发布消息的类似博客的系统,是一个基于用户关系的信息分享、传播以及获取平台。微博被称为中国的“Twitter”,因为它类似于Twitter。微博不仅可以满足用户相互推荐彼此感兴趣的网络咨询,还可以关注自己欣赏的名人或朋友,查看别人的最新动态或发表自己的最新言论,从而达到与别人分享快乐的目的,因此微博得到了越来越多人的喜爱。

然而,从用户的使用习惯和不同的文化角度来看,微博和“Twitter”是不同的。根据惠普实验室的研究,人们在微博上更喜欢转发信息而不是发表原创的微博,只要分享的有价值,人们在微博上会很热心帮助转发。此外,两者在用户体验方面也不同。在“Twitter”,人们只能分享文本信息,但在微博中,人们还能够分享图片、视频和音频。此外,微博也允许用户回复状态并在同一时间转发,这在“Twitter”是不可行的。

随着微博的广泛发展,出现了许多虚假用户,即僵尸用户。这些僵尸用户的出现存在很多方面的原因。一方面,为了满足微博用户的虚荣心和提高个人微博的关注度,有些人选择花钱买一些虚假的用户来提高自己的用户丝数目,这种行为大大降低了用户的个人诚信;另一方面就是有人利用微博的这种检测漏洞大肆贩卖“僵尸用户”,那些在背后控制“僵尸用户”的人通过交易获取不小的利益,致使僵尸用户产业链的产生,为微博带来不小的负面影响。这也是微博与“Twitter”的一个明显区别。

现在,有许多人研究西方社交网站,然而,对中国社交网络的研究却是一片空白。由于微博和“Twitter”的巨大差异,所以,本领域的技术人员致力于开发一种检测微博僵尸用户的方法。

发明内容

有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种基于可视化关系图分析的微博僵尸用户检测方法。

为实现上述目的,本发明提供了一种基于可视关系网络的微博僵尸用户检测方法,其特征在于,包括数据收集模块和关系图分析模块;

所述数据收集模块用于根据一个已知僵尸用户,收集所述已知僵尸用户的数据,并挑选出样本用户;

所述关系图分析模块用于判断所述样本用户是否是僵尸用户,具体包括以下步骤:

步骤201,将所述已知僵尸用户和所述样本用户的关系属性可视化,作出关系图:所述已知僵尸用户和所述样本用户均作为所述关系图的节点;

步骤202,初始化所述已知僵尸用户和所述样本用户的恶意评分;

步骤203,分析所述关系图的共性,计算所述关系图中各个所述节点的关联性数值,并按照传播规则和所述关系图计算和更新所述样本用户的恶意评分;

步骤204,判断所述样本用户的所述恶意评分是否传播收敛,如果传播收敛,跳入步骤205;如果不传播收敛,则跳转入步骤203;

步骤205,判断所述样本用户的所述恶意评分是否大于阈值,如果大于所述阈值,则跳转入步骤206;如果小于所述阈值,则所述样本用户被判定为正常用户;

步骤206:所述样本用户被判定为僵尸用户;

步骤207:处理完毕。

进一步地,所述数据收集模块是通过微博API收集的所述已知僵尸用户的数据。

进一步地,所述已知僵尸用户的数据包括用户粉丝和关注者的名字以及数量。

进一步地,所述数据收集模块对所述样本用户的选择是随机的。

进一步地,所述数据收集模块选择的所述样本用户的用户粉丝和关注者的数量小于1000。

进一步地,所述步骤201的所述关系图的相邻节点之间有关注与被关注的关系。

进一步地,在所述步骤202中,所述已知僵尸用户的恶意评分初始化为1,所述样本用户的恶意评分初始化为0。

进一步地,在所述步骤203中,所述节点的所述关联性数值为所述节点所对应的用户的粉丝数量的倒数。

进一步地,所述步骤203中的所述传播规则包括:

a),当计算一个用户的粉丝的恶意评分时,粉丝的恶意评分为用户的恶意评分乘以用户的关联性数值;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310396404.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top