[发明专利]用户识别方法和装置在审
申请号: | 202110343619.2 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113129054A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 张泽磊;李健宇 | 申请(专利权)人: | 广州博冠信息科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62;H04N21/441 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 赵昀彬;宫传芝 |
地址: | 510600 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 识别 方法 装置 | ||
1.一种用户识别方法,其特征在于,包括:
获取第一特征集合,其中,所述第一特征集合包括:第一用户的多个第一特征和第二用户的多个第一特征,所述第一用户为属于正常行为的用户,所述第二用户为存在异常行为的用户;
基于所述第一特征集合中的第一特征之间的相似度,对所述第一特征进行筛选,得到目标特征集合;
基于所述目标特征集合,构建训练数据;
利用训练数据对用户识别模型进行训练,其中,所述用户识别模型用于检测待识别用户是否存在异常行为。
2.根据权利要求1所述的方法,其特征在于,获取所述第一特征集合包括:
获取所述第一用户的第一行为数据,以及所述第二用户的第二行为数据,其中,所述第一行为数据与所述第二行为数据的类型相同;
基于所述第一行为数据和所述第二行为数据,生成第二特征集合;
生成每个第二特征对应的特征箱型图,其中,所述箱型图包括:所述第一用户的第一箱型图和所述第二用户的第二箱型图;
基于所述每个第二特征对应的特征箱型图,对所述第二特征集合中的第二特征进行筛选,得到所述第一特征集合。
3.根据权利要求2所述的方法,其特征在于,基于所述每个第二特征对应的特征箱型图,对所述第二特征集合中的第二特征进行筛选,得到所述第一特征集合包括:
将所述每个第二特征对应的所述第一箱型图和所述第二箱型图进行比较,得到所述每个第二特征对应的比较结果,其中,所述比较结果用于表征所述第一用户的第一数据分布与所述第二用户的第二数据分布的相似度是否小于第一阈值;
基于所述比较结果,对所述第二特征集合中的第二特征进行筛选,得到所述第一特征集合,其中,筛选出的第二特征对应的比较结果为所述第一数据分布与所述第二数据分布的相似度小于所述第一阈值。
4.根据权利要求2所述的方法,其特征在于,基于所述第一行为数据和所述第二行为数据,生成第二特征集合包括:
确定所述第二用户的行为数据中存在异常的行为数据,得到目标行为数据;
对所述目标行为数据进行特征提取,得到所述第二特征集合。
5.根据权利要求1所述的方法,其特征在于,基于所述第一特征集合中的第一特征之间的相似度,对所述第一特征进行筛选,得到目标特征集合包括:
基于所述第一特征集合中的第一特征之间的相似度,生成热力图;
获取所述第一特征的模型评价指标值,其中,所述模型评价指标值用于表征通过所述用户识别模型识别得到的正例样本排在反例样本前面的比例;
基于所述热力图和所述模型评价指标值对所述第一特征进行筛选,得到所述目标特征集合。
6.根据权利要求5所述的方法,其特征在于,获取所述第一特征的模型评价指标值包括:
利用所述第一特征训练所述用户识别模型进行训练,得到所述模型评价指标值。
7.根据权利要求5所述的方法,其特征在于,基于所述热力图和所述模型评价指标值对所述第一特征进行筛选,得到所述目标特征集合包括:
基于所述热力图,确定相似度大于第二阈值的第一特征,得到待筛选特征集合;
获取所述待筛选特征集合中,模型评价指标值最大的待筛选特征,得到所述目标特征集合。
8.根据权利要求1所述的方法,其特征在于,利用皮尔逊相关系数确定所述第一特征之间的相似度。
9.根据权利要求1所述的方法,其特征在于,基于所述目标特征集合,构建所述训练数据包括:
获取所述目标特征集合中当前时刻之前的预设时刻的目标特征;
确定所述目标特征对应的当前时刻的标签,其中,所述标签用于表征是否为所述第二用户;
基于所述目标特征和所述目标特征对应的标签,生成所述训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州博冠信息科技有限公司,未经广州博冠信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110343619.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于遗传算法的个性化试卷推送方法
- 下一篇:一种带备用电源的计算机主机