[发明专利]一种在微博平台上识别机器人用户的方法有效
申请号: | 201110419266.6 | 申请日: | 2011-12-14 |
公开(公告)号: | CN102571485A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | 周异;陈凯;林成峰;周曲;杨小康 | 申请(专利权)人: | 上海交通大学 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L29/08;G06F17/30 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 平台 识别 机器人 用户 方法 | ||
技术领域
本发明涉及一种社交网络领域,具体地说,涉及的是一种在微博平台上识别机器人用户的方法。
背景技术
在Web2.0时代,社交网络日益成为人们网络生活的重要组成部分,其中微博(micro-blog)这种网络服务更是成为了最红火的概念。微博是一个基于用户关系的信息分享、传播以及获取平台,用户可以通过WEB、WAP以及各种客户端组件个人社区,以140字左右的文字更新信息,并实现即时分享。从国外的twitter到国内的新浪,对用户的技术门槛都很低,同时微博api的存在使得用户可以在各种移动终端上登录微博发布消息,这也加速了微博的发展。
随着高速发展而来的是各种各样的问题,机器人账户、僵尸粉网络及其带来的内容污染和舆论误导等问题日益严重。国内外有众多的专家学者都开始研究机器人账户的检测和垃圾内容的过滤技术。微博服务提供商也建立了诸如IP检测、用户举报等检测机制来发现和限制这些恶意的账号。
从用户的社会关系特征这个角度来看,一般的机器人用户的好友不会像正常人类用户那样形成若干个密集的节点集合。因此如果分析关系图的节点聚集情况,可以用来区分机器人用户和普通账户。
发明内容
本发明的目的在于针对目前微博平台上的机器人账号泛滥的情况,提出一种微博平台上识别机器人用户的方法,该方法区别于传统的用户举报等检测机制,这种方法是建立在分析用户的社会关系特点上,具有更高的主动性和精确性。
为实现上述目的,本发明所述的微博平台上识别机器人用户的方法,包括以下步骤:
步骤1:利用已注册的账号登录微博;
步骤2:综合目标用户的关注和粉丝列表页面,得到好友列表;
步骤3:获得这些好友之间的关系矩阵,这其中包括获得好友和好友之间的关系以及交互系数K;
步骤4:将得到的好友关系矩阵(包括交互系数K)作为Fruchterman-Reingold算法的输入参数,利用该算法绘制出好友社会关系图;
步骤5:处理分析关系图得到节点密度分布矩阵matrix;
步骤6:利用步骤5得到的密度分布矩阵判断账户是否是机器人账户。
上述步骤3中,需要通过步骤2得到的好友列表来获得用户好友之间的关系矩阵,具体过程如下:
(1)对好友列表中的好友进行遍历;
(2)获取每个好友的好友列表;
(3)将每个好友的好友列表中的人员和用户好友列表中的人员进行比较,得到每个好友和用户的共同好友;
(4)对每一对好友建立一个3维向量,每一维分表代表用户A和B以及AB间的交互系数;
(5)对每一个用户对,搜集用户之间的评论和次数,计算交互系数K,K的值由基准值和浮动值两个部分组成,所述浮动值通过将评论数和次数加权平均的方法计算得到。
步骤4中,利用修改后Fruchterman-Reingold算法绘制出好友社会关系图,具体过程如下:
(1)初始化画布、万有引力系数、库伦系数、起始步长时间等参数;
(2)获得步骤3中三位向量组成的关系矩阵;
(3)按照关系矩阵的元素初始化节点列表和边列表,以及边的弹性系数,该边的弹性系数由交互系数K决定;
(4)开始迭代;
(5)计算每一个节点所受的合力,包括弹力、万有引力、库伦斥力;
(6)计算节点受力后在步长时间内的速度变化和位移,更新每个节点的速度和位移信息;
(7)计算系统的总动能;
(8)判断迭代结束条件是否满足,即动能小于某个阈值或者迭代次数超过某个阈值,如果不满足返回(5),否则进行(9);
(9)结束迭代,记录每个节点的最终位置;输出结果。
本发明跳出传统的检测思路,利用用户的社会关系特点来发现机器人账号,通过微博搜集用户好友之间的关系信息以及交互信息,然后利用Fruchterman-Reingold算法绘制出关系图网络图,再分析图中节点的密度分布,利用这个信息来识别机器人和正常用户。本发明给出了一种基于社会关系信息分析的微博机器人账号检测方法。相比于传统的举报、ip检测等机制,拥有更高的主动性和精确性。
附图说明
图1是本发明方法的流程图。
图2是数据收集好友社会关系信息的流程。
图3是获取交互信息并计算交互系数的流程
图4是修改后的Fruchterman-Reingold算法的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110419266.6/2.html,转载请声明来源钻瓜专利网。