[发明专利]风险用户识别方法、装置、电子设备及存储介质在审
| 申请号: | 202210933371.X | 申请日: | 2022-08-04 |
| 公开(公告)号: | CN115392351A | 公开(公告)日: | 2022-11-25 |
| 发明(设计)人: | 吴淑媛;魏伟强;袁成 | 申请(专利权)人: | 广州虎牙科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06Q10/06 |
| 代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 张庆玲 |
| 地址: | 511400 广东省广州市番禺*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 风险 用户 识别 方法 装置 电子设备 存储 介质 | ||
1.一种风险用户识别方法,其特征在于,包括:
获取到第一集合;其中,所述第一集合包括多个用户特征向量;
计算得到所述第一集合中每两个所述用户特征向量之间的相似度;
基于所述每一个用户特征向量与所述每两个所述用户特征向量之间的相似度,将所述第一集合划分为多个群组;
确定每一个所述群组的风险分数,并获取每一个所述群组中的至少一个频繁项集;其中,每一个所述频繁项集均对应至少一条风险识别规则;
根据每一个所述群组的所述风险分数以及所述频繁项集生成对应的风险信息,以通过所述风险信息对风险用户进行识别。
2.根据权利要求1所述的风险用户识别方法,其特征在于,
所述获取到第一集合的步骤,包括:
收集到预设数量的多个用户数据;其中,所述用户数据包括结构化数据与非结构化数据;
对所述多个用户数据进行预处理,以获取到第二集合;其中,所述第二集合包括多个用户初始特征向量;
利用信息熵表征每一个所述用户初始特征向量的权重值;
基于每一个所述用户初始特征向量与对应的所述权重值获取到每一个所述用户特征向量,以基于所述多个用户特征向量组成所述第一集合。
3.根据权利要求2所述的风险用户识别方法,其特征在于,
所述对所述多个用户数据进行预处理,以获取到第二集合的步骤,包括:
对每一个所述结构化数据以及所述非结构化数据进行统计,并基于统计结果清洗异常数据;
基于所述统计结果对数值型数据进行排序,并对排序后的数值型数据进行分桶,以将所述排序后的数值型数据转化为所述用户初始特征向量,并基于多个所述用户初始特征向量构建所述第二集合。
4.根据权利要求3所述的风险用户识别方法,其特征在于,
所述基于每一个所述用户初始特征向量与对应的所述权重值获取到每一个所述用户特征向量,以基于所述多个用户特征向量组成所述第一集合的步骤,包括:
基于独热编码机制对每一个所述用户初始特征向量进行编码,以获取每一个所述用户初始特征向量对应的高维向量;其中,同一个用户对应多个所述用户初始特征向量;
将每一个所述高维向量乘以对应的权重值,以获取到多个拼接特征向量;
对属于同一个用户的多个所述拼接特征向量进行拼接,以获取到每一个所述用户特征向量,基于所述多个用户特征向量组成所述第一集合。
5.根据权利要求4所述的风险用户识别方法,其特征在于,
所述计算得到所述第一集合中每两个所述用户特征向量之间的相似度的步骤,包括:
利用至少一种相似度算法确定所述第一集合中每两个所述用户特征向量之间的所述相似度。
6.根据权利要求1或5所述的风险用户识别方法,其特征在于,
所述基于所述每一个用户特征向量与所述每两个所述用户特征向量之间的相似度,将所述第一集合划分为多个群组的步骤,包括:
确定邻域参数;其中,所述邻域参数包括聚类半径以及每一个聚类样本的最小数目;
基于所述每两个所述用户特征向量之间的相似度进行计算,以得到每一个所述用户特征向量与其余所述用户向量特征之间的距离;
对同一个所述用户特征向量对应的多个距离进行统计,确定所述多个距离中数值小于所述聚类半径的个数;
响应于所述个数大于所述最小数目,将对应的所述用户特征向量确定为核心向量,并对所述核心向量添加对应的标签;
对所述第一集合中的多个所述用户特征向量进行遍历,以确定出所有的核心向量;
基于所述邻域参数确定位于每一个所述核心向量的邻域内的多个所述用户特征向量,并对所述位于每一个所述核心向量的邻域内的多个所述用户特征向量添加与对应的所述核心向量相同的标签;
将具有相同标签的多个用户特征向量划分到同一个群组中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州虎牙科技有限公司,未经广州虎牙科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210933371.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:视频叠加方法、装置、电子设备及可读存储介质
- 下一篇:一种方便拆卸的道具服





