[发明专利]风险识别的方法、装置及终端设备在审
申请号: | 202210431364.X | 申请日: | 2022-04-22 |
公开(公告)号: | CN114781517A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 李俊兵;陈振兴;王美青 | 申请(专利权)人: | 京东科技控股股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N5/02;G06Q40/08;G06Q50/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 单冠飞 |
地址: | 100176 北京市北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 风险 识别 方法 装置 终端设备 | ||
本公开提出一种风险识别的方法和装置,其中,方法包括:获取预设时间段内的各用户对应的业务数据集;对每个用户对应的业务数据进行预处理,以确定每个用户对应的媒介向量及行为向量;根据各个媒介向量间的相似度及各个行为向量间的相似度,确定各用户间的边关系;根据各用户间的边关系,将关系图谱进行社区划分,以确定关系图谱中包含的各个社区;根据每个社区中包含的边的属性信息,确定每个社区是否为具有风险的社区。由此,通过基于媒介向量与行为向量,在各用户之间的建立边的关系,再根据每个社区中包含的边的属性信息,确定每个社区是否为具有风险的社区,从而即简化了风险识别的复杂度,又提高了风险识别的准确度。
技术领域
本公开涉及人工智能识别分类技术领域,尤其涉及一种风险识别的方法、装置及终端设备。
背景技术
随着人工智能技术的迅速发展,风险控制的需求越来越多。
相关技术中,通常基于用户时序行为事件,训练分类模型,并基于此分类模型,识别对应的业务是否存在风险。该方法需要依赖大量的带标签的训练数据,但是由于带标签的训练数据集的获得难度较大,导致模型存在误判或者漏判的现象。因此,如何提供一种可靠的风险识别的方法,是目前亟需解决的问题。
发明内容
本公开提出一种风险识别的方法、装置及终端设备,以至少解决相关技术风险识别可靠性较低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,本公开实施例提供一种风险识别的方法,包括:
获取预设时间段内的各用户对应的业务数据集,其中,每条所述业务数据中包括媒介数据及行为数据;
对每个所述用户对应的业务数据进行预处理,以确定每个所述用户对应的媒介向量及行为向量;
根据各个所述媒介向量间的相似度及各个所述行为向量间的相似度,确定所述各用户间的边关系;
根据所述各用户间的边关系,将所述关系图谱进行社区划分,以确定所述关系图谱中包含的各个社区;
根据每个所述社区中包含的边的属性信息,确定每个所述社区是否为具有风险的社区。
本公开中,服务端在获取预设时间段内的各用户对应的业务数据集后,可以对每个用户对应的业务数据进行预处理,以确定每个用户对应的媒介向量及行为向量,之后根据各个媒介向量间的相似度及各个行为向量间的相似度,确定各用户间的边关系,并根据各用户间的边关系,将关系图谱进行社区划分,以确定关系图谱中包含的各个社区,然后再根据每个社区中包含的边的属性信息,确定每个社区是否为具有风险的社区。由此,通过基于媒介向量与行为向量,在各用户之间的建立边的关系,再根据每个社区中包含的边的属性信息,确定每个社区是否为具有风险的社区,从而即简化了风险识别的复杂度,又提高了风险识别的准确度。
在本公开第一方面实施例一种可能的实现方式中,在所述确定所述各用户间的边关系之后,还包括:
确定每条所述行为数据对应的操作对象的属性信息;
根据所述操作对象的属性信息,确定每个所述用户对应的扩展向量;
根据各个所述扩展向量间的相似度,对所述各用户间的边关系进行更新。
在本公开第一方面实施例一种可能的实现方式中,所述对每个所述用户对应的业务数据进行预处理,以确定每个所述用户对应的媒介向量及行为向量,包括:
将所述用户对应的每条业务数据中的媒介数据及行为数据分布进行向量映射,以确定所述用户对应的每个媒介向量及每个行为向量。
在本公开第一方面实施例一种可能的实现方式中,所述根据各个所述媒介向量间的相似度及各个所述行为向量间的相似度,确定所述各用户间的边关系,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技控股股份有限公司,未经京东科技控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210431364.X/2.html,转载请声明来源钻瓜专利网。