[发明专利]一种恶意用户的识别方法和系统有效
申请号: | 201611147191.X | 申请日: | 2016-12-13 |
公开(公告)号: | CN108616491B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 陈华 | 申请(专利权)人: | 北京酷智科技有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100190 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 恶意 用户 识别 方法 系统 | ||
1.一种恶意用户的识别方法,其特征在于,所述方法包括:
根据历史注册用户对应用的使用行为数据以及相应的属性信息确定初始真实用户样本集和初始恶意用户样本集;所述初始真实用户样本集包括初始的真实用户,所述初始恶意用户样本集包括初始的恶意用户;
根据指定维度的边缘行为数据从所述初始真实用户样本集中筛选最终的真实用户,以生成正样本集,所述边缘行为数据包括标记恶意用户未使用的行为数据而正常用户使用的行为数据;
根据指定维度的恶意行为数据从所述初始恶意用户样本集中筛选最终的恶意用户,以生成负样本集,所述恶意行为数据包括被其他用户举报的行为、发送黄色信息的行为或者操作行为大于系统设定的阈值其中至少一项;
针对所述正样本集与负样本集中的每一个注册用户,提取N个不同维度的边缘特征,以构建相应注册用户的特征向量,其中:所述提取N个不同维度的边缘特征包括:选取N个不同维度的边缘特征,针对正、负样本集中的每一个注册用户,分别提取所述选取的N个不同维度的边缘特征;所述边缘特征为传统恶意用户检测方法对注册用户进行识别没有利用的特征;
将所述正样本集与负样本集中每一个注册用户的特征向量作为输入,训练恶意用户识别模型;
对于新注册的用户,提取所述N个不同维度的边缘特征构建特征向量;
利用所述恶意用户识别模型对所述特征向量输入进行识别,以确定所述新注册用户是否为恶意用户。
2.如权利要求1所述的方法,其特征在于,所述根据历史注册用户对应用的使用行为数据以及相应的属性信息确定初始真实用户样本集和初始恶意用户样本集的步骤,包括:
对于每个历史注册用户,当所述历史注册用户的使用行为数据中有唱歌操作数据,且所述使用行为数据中除唱歌操作行为数据之外的其他使用行为数据小于等于相应的筛选条件阈值,且所述历史注册用户的属性信息中的注册IP是没有被禁封的历史记录,则将所述历史注册用户加入初始真实用户样本集;
当所述历史注册用户的使用行为数据中没有唱歌操作数据,且所述使用行为数据中除唱歌操作行为数据之外的其他使用行为数据大于相应的筛选条件阈值,且所述历史注册用户的属性信息中的注册IP有被禁封的历史记录,则将所述历史注册用户加入初始恶意用户样本集。
3.如权利要求1所述的方法,其特征在于,所述根据指定维度的恶意行为数据从所述初始恶意用户样本集中筛选最终的恶意用户,以生成负样本集的步骤,包括:
从所述初始恶意用户样本集中,选择已被禁封的恶意用户,以生成负样本集。
4.如权利要求1所述的方法,其特征在于,所述将所述正样本集与负样本集中每一个注册用户的特征向量作为输入,训练恶意用户识别模型的步骤之后,还包括:
定期检测历史注册用户对应用的使用行为数据,当检测到历史注册用户中的恶意用户对应用的使用行为数据包括指定维度的边缘行为数据,则将当前的所述指定维度的边缘行为数据进行更新。
5.如权利要求1所述的方法,其特征在于,所述将所述正样本集与负样本集中每一个注册用户的特征向量作为输入,训练恶意用户识别模型的步骤之后,还包括:
定期检测历史注册用户对应用的使用行为数据,当检测到历史注册用户中的恶意用户与所述恶意用户识别模型的识别结果不一致,则将当前的所述边缘特征进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京酷智科技有限公司,未经北京酷智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611147191.X/1.html,转载请声明来源钻瓜专利网。