[发明专利]一种在微博平台上识别机器人用户的方法有效
申请号: | 201110419266.6 | 申请日: | 2011-12-14 |
公开(公告)号: | CN102571485A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | 周异;陈凯;林成峰;周曲;杨小康 | 申请(专利权)人: | 上海交通大学 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L29/08;G06F17/30 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 平台 识别 机器人 用户 方法 | ||
1.一种在微博平台上识别机器人用户的方法,其特征在于包括以下步骤:
步骤1:利用已注册的账号登录微博;
步骤2:综合目标用户的关注和粉丝列表页面,得到好友列表;
步骤3:获得这些好友之间的关系矩阵,这其中包括获得好友和好友之间的关系以及交互系数K,矩阵由多个三维向量组成,每一维分别代表拥有好友关系的两个用户A和B以及AB间的交互系数K;
步骤4:将得到的好友关系矩阵,包括交互系数K,作为Fruchterman-Reingold算法的输入参数,利用该算法绘制出好友社会关系图;
步骤5:处理分析关系图得到节点密度分布矩阵matrix;
步骤6:利用步骤5得到的密度分布矩阵判断账户是否是机器人账户。
2.根据权利要求1所述的在微博平台上识别机器人用户的方法,其特征在于步骤3中,需要通过步骤2得到的好友列表来获得用户好友之间的关系矩阵,具体过程如下:
(1)对好友列表中的好友进行遍历;
(2)获取每个好友的好友列表;
(3)将每个好友的好友列表中的人员和用户好友列表中的人员信息进行比较,得到每个好友和用户的共同好友;
(4)对每一对好友建立一个3维向量,每一维分表代表用户A和B以及AB间的交互系数;
(5)对每一个用户对,搜集用户之间的评论和次数,计算交互系数K,K的值由基准值和浮动值两个部分组成,即K=Kb+Kf,基准值Kb的选取取决于库仑斥力系数,Kf的浮动范围在0~50%Kb。
3.根据权利要求1或2所述的在微博平台上识别机器人用户的方法,其特征在于步骤4中,利用修改后Fruchterman-Reingold算法绘制出好友社会关系图,具体过程如下:
(1)初始化画布、万有引力系数、库伦系数、起始步长参数;
(2)获得步骤3中三位向量组成的关系矩阵;
(3)按照关系矩阵的元素初始化节点列表和边列表,以及边地弹性系数,该边地弹性系数由交互系数K决定;
(4)开始迭代;
(5)计算每一个节点所受的合力,包括弹力、万有引力、库伦斥力;
(6)计算节点受力后在步长时间内的速度变化和位移,更新每个节点的速度和位移信息;
(7)计算系统的总动能;
(8)判断迭代结束条件是否满足,即动能小于某个阈值或者迭代次数超过某个阈值,如果不满足返回(5),否则进行(9);
(9)结束迭代,记录每个节点的最终位置;输出结果。
4.根据权利要求1或2所述的在微博平台上识别机器人用户的方法,其特征在于步骤5中,具体如下:
首先将画布划分为100块小块;然后遍历每个节点的坐标,判断它落在哪个分块中,将相应分块的节点数加一,完成遍历后统计每个分块的节点数量,得到密度分布矩阵,矩阵为一个10*10的二维矩阵,每个元素代表相应分块中的节点数量。
5.根据权利要求1或2所述的在微博平台上识别机器人用户的方法,其特征在于步骤6,具体为:将每个分块的密度和预设的密度阈值比较,统计超过阈值的分块数量,然后将这个数量和预设的数量阈值进行比较,如果超过数量阈值,则说明用户符合正常用户的社会网络特点,否则是机器人账户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110419266.6/1.html,转载请声明来源钻瓜专利网。