[发明专利]基于图算法和聚类算法的批量注册账号检测方法在审
| 申请号: | 202010988899.8 | 申请日: | 2020-09-18 |
| 公开(公告)号: | CN112116007A | 公开(公告)日: | 2020-12-22 |
| 发明(设计)人: | 普雪飞 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00 |
| 代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 郭会 |
| 地址: | 621000 四*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 算法 批量 注册 账号 检测 方法 | ||
本发明公开了一种基于图算法和聚类算法的批量注册账号检测方法,包括步骤:A.收集注册用户的第一账号数据与第二账号数据;B.根据第一账号数据与第二账号数据建立账号和账号间的关联关系形成账号关联关系网;C.设定账号数量阈值,提取包含的账号数量不小于账号数量阈值的账号关联关系网;D.计算提取出的账号关联关系网中各账号间的编辑距离得到各账号间的编辑距离矩阵;E.设定编辑距离阈值,根据得到的编辑距离矩阵进行账号的聚类,将账号间的编辑距离不超过编辑距离阈值的账号划分为一个类团。本发明的方法利用计算账号间的关联关系替代计算账号间的行为相似度,简化了基于行为相似度方法的数据准备流程和计算复杂度,从而提升检测效率。
技术领域
本发明涉及异常账号检测技术领域,特别涉及一种基于图算法和聚类算法的批量注册账号检测方法。
背景技术
互联平台中往往存在着大量的恶意账号,例如被批量注册的账号被用于获取一些不正当的利益,这些账号被用于发布垃圾信息、虚假信息、钓鱼信息。此外,当平台发布一些促销返利活动时,这些账号会被用于获取相应的利益,并且大部分时间内这些账号的活跃度较低,类似于僵尸账号,这些批量注册的账号严重的扰乱了互联网秩序。
目前用于批量注册账号检测普遍的方法是观测这些账号的名称和行为规律,一般来说批量注册的账号相比与正常账号,活跃度较低,且群体行为较为相似,账号名称相似度高。账号的行为相似度描述方法多种多样,比如账号一段时间内的登录行为、信息发布行为等等,需要的数据维度多,计算复杂,且需要一段时间的历史数据积累,所以导致检测效率较低。
而一般情况下这些账号都是恶意用户用脚本批量生成的,所以这些账号在名称上往往具有相似性,再者,用户在使用这些批量注册的账号时可能会在相同设备上进行登录,所以根据账号和设备登录的关系,可以建立起一个图结构的关联关系网络,从而将很多个账号关联在一起。而正常的账号往往相对独立。所以利用这些特性,本发明的技术方案就基于图结构和聚类算法,将名字相似并具有关联性的账号检测出来划分为一个类团,并通过设定一个数量阈值,当类团中的账号超过这个数量阈值时,将这些账号判定为恶意批量注册的账号。
发明内容
本发明的目的是克服上述背景技术中不足,提供一种基于图算法和聚类算法的批量注册账号检测方法,利用图算法和层次聚类算法构建了一个自动化的批量注册的垃圾账号检测方法,能有效的检测批量注册的账号,同时利用计算账号间的关联关系替代计算账号间的行为相似度,简化了基于行为相似度方法的数据准备流程和计算复杂度,从而提升检测效率。
为了达到上述的技术效果,本发明采取以下技术方案:
基于图算法和聚类算法的批量注册账号检测方法,包括步骤:
A.收集注册用户的第一账号数据与第二账号数据;
B.根据所述第一账号数据与第二账号数据建立账号和账号间的关联关系形成账号关联关系网;
C.设定账号数量阈值,提取包含的账号数量不小于账号数量阈值的账号关联关系网;
D.计算提取出的账号关联关系网中各账号间的编辑距离得到各账号间的编辑距离矩阵;
E.设定编辑距离阈值,根据得到的编辑距离矩阵进行账号的聚类,将账号间的编辑距离不超过编辑距离阈值的账号划分为一个类团;聚类是将具有相似属性的样本点划归成一类的方法,本发明中样本相似属性通过编辑距离来度量。先计算样本之间的距离,每次将距离最近的点合并到同一个类,然后,再计算类与类之间的距离,将距离最近的类合并为一个大类,不停的合并,直到合成了一个类;
F.设定账号数目阈值,判定包含的账号数量大于账号数目阈值的类团中的账号为批量注册的账号。
进一步地,所述第一账号数据为账号名,所述第二账号数据为账号登录过的设备id,账号和设备id信息可以由后端程序记录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010988899.8/2.html,转载请声明来源钻瓜专利网。





