[发明专利]数据处理方法、装置、设备及介质有效
| 申请号: | 202210119110.4 | 申请日: | 2022-02-08 |
| 公开(公告)号: | CN114168805B | 公开(公告)日: | 2022-05-20 |
| 发明(设计)人: | 李力 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/901 | 分类号: | G06F16/901 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 李文静 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据处理 方法 装置 设备 介质 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
获取目标有向带权图,所述目标有向带权图中包括至少两个数据节点,所述至少两个数据节点之间包括带权重的有向边,所述权重用于指示所述至少两个数据节点之间的有向关联度;
基于所述有向边在所述至少两个数据节点之间的指向关系,确定所述至少两个数据节点分别对应的出度数和入度数;所述入度数表示指向所述数据节点的有向边的数量,所述出度数表示从所述数据节点指出的有向边的数量;
以所述至少两个数据节点为基础,对所述有向边对应的权重进行排序,在预设度数的范围内保留权重最大的符合所述预设度数的有向边,并对其他有向边进行裁剪,确定至少一个子图;
基于所述目标有向带权图中的有向边对应的权重,确定所述至少一个子图分别对应的全局权值,并基于所述全局权值,从所述至少一个子图中确定目标子图;
基于所述目标子图中的有向边分布情况,确定所述至少两个数据节点之间的数据关联度。
2.根据权利要求1所述的方法,其特征在于,所述在预设度数的范围内保留权重最大的符合所述预设度数的有向边,并对其他有向边进行裁剪,确定至少一个子图,包括:
在所述预设度数的范围内,保留所述至少两个数据节点中每一个数据节点对应的权重最大的符合所述预设度数的有向边,并对其他有向边进行裁剪,得到所述至少一个子图对应的子图有向边;
基于所述至少两个数据节点和所述子图有向边,得到所述目标有向带权图对应的所述至少一个子图。
3.根据权利要求2所述的方法,其特征在于,所述预设度数包括预设出度数和预设入度数;
所述对其他有向边进行裁剪,包括:
对从所述数据节点指出的有向边进行裁剪;
对指向所述数据节点的有向边进行裁剪。
4.根据权利要求1所述的方法,其特征在于,所述基于所述目标有向带权图中的有向边对应的权重,确定所述至少一个子图分别对应的全局权值,包括:
基于所述目标有向带权图中的有向边对应的权重,确定所述子图有向边对应的权重;
对第i个子图中子图有向边对应的权重进行求和,确定所述第i个子图对应的全局权值,其中,i为正整数。
5.根据权利要求4所述的方法,其特征在于,所述基于所述目标子图中的有向边分布情况,确定所述至少两个数据节点之间的数据关联度,包括:
对所述目标子图中每一个数据节点对应的目标子图有向边的权值进行排序,确定权值序列;
基于所述权值序列的排序情况,确定所述至少两个数据节点之间的数据关联度。
6.根据权利要求1至5任一所述的方法,其特征在于,所述获取目标有向带权图,包括:
获取参与关联度分析的至少两个数据节点;
基于所述至少两个数据节点之间的关联度关系,确定所述至少两个数据节点分别对应的有向边;
以所述至少两个数据节点和所述有向边为基础,构建所述目标有向带权图。
7.根据权利要求1至5任一所述的方法,其特征在于,所述基于所述全局权值,从所述至少一个子图中确定目标子图,包括:
从所述全局权值中,确定符合预设标准的目标全局权值;
将所述目标全局权值对应的子图确定为所述目标子图。
8.根据权利要求7所述的方法,其特征在于,所述从所述全局权值中,确定符合预设标准的目标全局权值,包括:
将所述全局权值中的最大权值作为所述目标全局权值。
9.根据权利要求7所述的方法,其特征在于,所述将所述目标全局权值对应的子图确定为所述目标子图,包括:
将所述目标全局权值对应的至少一个子图构成候选子图集合;
从所述候选子图集合中,确定所述目标子图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210119110.4/1.html,转载请声明来源钻瓜专利网。





