[发明专利]针对关系网络的数据处理方法及装置在审
申请号: | 202110889120.1 | 申请日: | 2021-08-04 |
公开(公告)号: | CN113672740A | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 郭亚;祝慧佳 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06N3/04;G06N3/08;G06Q10/06;G06Q30/00 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 关系 网络 数据处理 方法 装置 | ||
本说明书实施例提供一种针对关系网络的数据处理方法及装置,在相应实施例中,针对关系网络中的目标实体,通过路径挖掘其拓扑结构信息。其中,拓扑结构信息通过多个基准路径对应的路径特征项上的特征值表示,而基准路径是从各个目标节点为起点的随机游走路径中筛选出来的,可以挖掘节点之间的共性。将路径特征加入相应节点的预测业务的数据处理过程,这种实施方式可以提高针对目标节点的预测业务处理的结果准确性,以及提高关系网络的可用性。
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及针对关系网络的数据处理方法及装置。
背景技术
关系网络,顾名思义,可以是描述各种实体的关系的网络图。例如,知识图谱(Knowledge Graph)作为一种揭示实体之间关系的语义网络,本质上就是关系网络。关系网络(图)可以存在于各种现实场景中。例如,在内容风控中,也存在大量的关系网络,比如:在小程序评论中,用户和小程序分别作为实体,存在评论关系;用户和用户实体之间存在好友或者同介质关系等。在实际的风险识别中,类似的关系图的拓扑特征是非常有帮助的。比如识别小程序刷评风险,如果一个小程序的评价用户包含大量同介质(使用相同介质,如同一个IP、同一个wifi、同一台设备、同一个用户ID等等)用户,那么其有可能存在恶意串通控制评论的舆论风向(如水军刷评)风险。
常规技术中,更多的是通过关系统计实体的类似关系特征,比如统计小程序的评价用户中存在同介质关系的用户数等。这种方式需要有专家经验进行设计挖掘,同时在需要进行多度关联(如多种介质关联)统计时,其计算量指数增长,可能对设备的计算力和存储力产生较高要求。
发明内容
本说明书一个或多个实施例描述了一种针对关系网络的数据处理方法及装置,用以解决背景技术提到的一个或多个问题。
根据第一方面,提供一种针对关系网络的数据处理方法,其中,所述关系网络用于描述多个节点之间的关联关系,各个节点分别对应各个实体,对应具有关联关系的实体的两两节点之间通过连接边连接;所述方法包括:针对第一类型实体对应的各个第一节点,分别通过随机游走确定各自对应的若干条编码路径,其中,单条编码路径按照节点出现顺序,用对应的实体类型进行编码得到;对各条编码路径进行筛选,得到多条基准路径;根据各个第一节点为起点的路径各自匹配到各个基准路径的条数,提取各个第一节点分别对应的路径特征;针对各个第一节点,分别将相应的节点特征和路径特征融合,从而用于关于第一节点的预测业务处理。
在一个实施例中,所述针对第一类型实体对应的各个第一节点,分别通过随机游走确定各自对应的若干条编码路径包括:以单个第一节点为起始点,按照预设的最大路径长度进行随机游走,得到若干条随机游走的路径,其中,针对该单个第一节点确定的随机游走路径不大于预定条数,其中,在单个第一节点的全部路径条数小于预定路径条数的情况下,根据该单个第一节点对应的全部路径均确定为随机游走路径;针对各条随机游走的路径分别确定相应的各条编码路径。
在一个进一步的实施例中,针对单条随机游走路径,通过以下方式确定相应的单个编码路径:按照单个随机游走路径中各个节点的出现顺序,依次确定各个节点的编码结果,其中,针对随机游走的路径上的单个节点,在该单个节点在当前路径中首次出现的情况下,通过相应实体类型和该实体类型在当前路径中出现的节点数为该单个节点进行编码,在该单个节点在当前路径中非首次出现的情况下,使用首次出现的编码结果;根据该单个随机游走路径上各个节点按顺序的编码结果,确定单个编码路径。
在一个实施例中,所述对各条编码路径进行筛选,得到多条基准路径包括:对各条编码路径中重复的编码路径择一保留,从而从各条编码路径筛选出多条基准路径。
在一个实施例中,所述对各条编码路径进行筛选,得到多条基准路径包括:统计各条编码路径分别在所述关系网网络的各个出现频次;筛除出现频次低于预定频次阈值的编码路径,将未被筛除的编码路径作为基准路径。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110889120.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:光学系统和头戴显示设备
- 下一篇:敏感信息检测方法及装置