[发明专利]基于图算法和聚类算法的批量注册账号检测方法在审
| 申请号: | 202010988899.8 | 申请日: | 2020-09-18 |
| 公开(公告)号: | CN112116007A | 公开(公告)日: | 2020-12-22 |
| 发明(设计)人: | 普雪飞 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00 |
| 代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 郭会 |
| 地址: | 621000 四*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 算法 批量 注册 账号 检测 方法 | ||
1.基于图算法和聚类算法的批量注册账号检测方法,其特征在于,包括步骤:
A.收集注册用户的第一账号数据与第二账号数据;
B.根据所述第一账号数据与第二账号数据建立账号和账号间的关联关系形成账号关联关系网;
C.设定账号数量阈值,提取包含的账号数量不小于账号数量阈值的账号关联关系网;
D.计算提取出的账号关联关系网中各账号间的编辑距离得到各账号间的编辑距离矩阵;
E.设定编辑距离阈值,根据得到的编辑距离矩阵进行账号的聚类,将账号间的编辑距离不超过编辑距离阈值的账号划分为一个类团;
F.设定账号数目阈值,判定包含的账号数量大于账号数目阈值的类团中的账号为批量注册的账号。
2.根据权利要求1所述的基于图算法和聚类算法的批量注册账号检测方法,其特征在于,所述第一账号数据为账号名,所述第二账号数据为账号登录过的设备id。
3.根据权利要求2所述的基于图算法和聚类算法的批量注册账号检测方法,其特征在于,所述步骤B中是采用图结构来表示账号之间的关联关系。
4.根据权利要求3所述的基于图算法和聚类算法的批量注册账号检测方法,其特征在于,所述步骤B具体是以账号名和设备id为节点,登录行为为边。
5.根据权利要求2所述的基于图算法和聚类算法的批量注册账号检测方法,其特征在于,所述步骤D的编辑距离具体采用莱文斯坦距离,具体是计算账号名与账号名之间的编辑距离。
6.根据权利要求5所述的基于图算法和聚类算法的批量注册账号检测方法,其特征在于,所述步骤E中包括将一个独立的账号并入一个类团A形成一个新的类团B或将一个类团C并入一个类团D形成一个新的类团E;其中,判定一个账号可以并入类团A形成类团B的标准为该账号的账号名与类团A包含的至少一个账号的账号名的编辑距离不超过编辑距离阈值,判定类团C可以并入类团D形成类团E的标准为类团C包含的至少一个账号的账号名与类团D包含的至少一个账号的账号名的编辑距离不超过编辑距离阈值。
7.根据权利要求1至6中任一所述的基于图算法和聚类算法的批量注册账号检测方法,其特征在于,所述账号数量阈值不小于10。
8.根据权利要求1至6中任一所述的基于图算法和聚类算法的批量注册账号检测方法,其特征在于,所述编辑距离阈值大于1小于5。
9.根据权利要求1至6中任一所述的基于图算法和聚类算法的批量注册账号检测方法,其特征在于,所述账号数目阈值不小于10。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010988899.8/1.html,转载请声明来源钻瓜专利网。





