[发明专利]风险用户识别方法、装置、电子设备及存储介质在审
| 申请号: | 202210933371.X | 申请日: | 2022-08-04 |
| 公开(公告)号: | CN115392351A | 公开(公告)日: | 2022-11-25 |
| 发明(设计)人: | 吴淑媛;魏伟强;袁成 | 申请(专利权)人: | 广州虎牙科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06Q10/06 |
| 代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 张庆玲 |
| 地址: | 511400 广东省广州市番禺*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 风险 用户 识别 方法 装置 电子设备 存储 介质 | ||
本申请公开了风险用户识别方法、装置、电子设备及存储介质,包括:获取到第一集合;其中,第一集合包括多个用户特征向量;计算得到第一集合中每两个用户特征向量之间的相似度;基于每一个用户特征向量与每两个用户特征向量之间的相似度,将第一集合划分为多个群组;确定每一个群组的风险分数,并获取每一个群组中的至少一个频繁项集;其中,每一个频繁项集均对应至少一条风险识别规则;根据每一个群组的风险分数以及频繁项集生成对应的风险信息,以通过风险信息对风险用户进行识别。本申请能够在短时间内识别出新的欺诈模式,并基于新的欺诈模式对风险用户进行识别,以实现提前防控,且由于无需依赖标注样本,还能够提高识别效率及识别准确率。
技术领域
本申请涉及风控技术领域,特别是涉及风险用户识别方法、装置、电子设备及存储介质。
背景技术
随着互联网技术的发展,用户习惯在运行相关业务的网络服务提供商的系统中注册账户,然后将账户作为其身份的代表来执行相关的业务逻辑。然而,各种不法人员,通常将注册的账户用于进行欺诈等犯罪行为,不仅危害了企业的利益,也危害了用户个人信息安全。
现有技术中,主要是基于规则引擎的方法和基于监督机器分类模型的方法对风险用户进行识别。其中,基于规则引擎的方式包括将风控专家的经验知识转化为欺诈防范业务规则,或,建立黑白名单规则,以通过规则引擎的方式进行匹配。基于监督机器分类模型的方法是通过收集黑产样本并提取相应的特征,继而利用监督机器学习方法构建分类模型,以通过分类模型识别风险用户。
然而,基于规则引擎的方式过分依赖于人工,成本较高,而基于监督机器分类模型的方法又需要大量的带标签数据,受限于标签的积累以及时效性,且上述方法均只能识别现有的欺诈模式,无法在较短时间内识别新型的欺诈模式,存在风险识别滞后的问题。
发明内容
本申请主要解决的技术问题是风险用户识别方法、装置、电子设备及存储介质,能够解决现有技术中存在的风险识别滞后的问题。
为解决上述技术问题,本申请采用的第一技术方案是提供一种风险用户识别方法,包括:获取到第一集合;其中,第一集合包括多个用户特征向量;计算得到第一集合中每两个用户特征向量之间的相似度;基于每一个用户特征向量与每两个用户特征向量之间的相似度,将第一集合划分为多个群组;确定每一个群组的风险分数,并获取每一个群组中的至少一个频繁项集;其中,每一个频繁项集均对应至少一条风险识别规则;根据每一个群组的风险分数以及频繁项集生成对应的风险信息,以通过风险信息对风险用户进行识别。
其中,获取到第一集合的步骤,包括:收集到预设数量的多个用户数据;其中,用户数据包括结构化数据与非结构化数据;对多个用户数据进行预处理,以获取到第二集合;其中,第二集合包括多个用户初始特征向量;利用信息熵表征每一个用户初始特征向量的权重值;基于每一个用户初始特征向量与对应的权重值获取到每一个用户特征向量,以基于多个用户特征向量组成第一集合。
其中,对多个用户数据进行预处理,以获取到第二集合的步骤,包括:对每一个结构化数据以及非结构化数据进行统计,并基于统计结果清洗异常数据;基于统计结果对数值型数据进行排序,并对排序后的数值型数据进行分桶,以将排序后的数值型数据转化为用户初始特征向量,并基于多个用户初始特征向量构建第二集合。
其中,基于每一个用户初始特征向量与对应的权重值获取到每一个用户特征向量,以基于多个用户特征向量组成第一集合的步骤,包括:基于独热编码机制对每一个用户初始特征向量进行编码,以获取每一个用户初始特征向量对应的高维向量;其中,同一个用户对应多个用户初始特征向量;将每一个高维向量乘以对应的权重值,以获取到多个拼接特征向量;对属于同一个用户的多个拼接特征向量进行拼接,以获取到每一个用户特征向量,基于多个用户特征向量组成第一集合。
其中,计算得到第一集合中每两个用户特征向量之间的相似度的步骤,包括:利用至少一种相似度算法确定第一集合中每两个用户特征向量之间的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州虎牙科技有限公司,未经广州虎牙科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210933371.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:视频叠加方法、装置、电子设备及可读存储介质
- 下一篇:一种方便拆卸的道具服





