[发明专利]一种基于图的卷积网络训练方法、装置及系统有效
申请号: | 201910041725.8 | 申请日: | 2019-01-16 |
公开(公告)号: | CN111445020B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 杨斯然;任毅;陈根宝;魏源;张研;田旭 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/084;G06N3/0464 |
代理公司: | 北京思格颂知识产权代理有限公司 11635 | 代理人: | 潘珺 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 网络 训练 方法 装置 系统 | ||
本发明公开了一种基于图的卷积网络训练方法、装置及系统。所述方法包括:为卷积模型除了最低层和最高层之外的每层建立第一存储空间;基于每个批次的训练数据和图,确定训练数据的各中心节点及中心节点的各邻居节点;针对每个中心节点,从前一层中心节点的各邻居节点标识对应的第一存储空间中获取各邻居节点的表征向量;根据前一层传递来的中心节点的表征向量及获取到的各邻居节点的表征向量,确定中心节点在本层中的表征向量,当当前层并非最低层或者最高层时,将确定出的表征向量传递至本层相邻的下一层并更新本层第一存储空间中中心节点标识对应的表征向量;直至得到中心节点在最高层的表征向量。本发明可有效降低训练的计算量和训练时间。
技术领域
本发明涉及机器学习技术领域,特别涉及一种基于图的卷积网络训练方法、装置及系统。
背景技术
随着移动终端及应用软件的普及,在社交、电商、物流、出行、外卖、营销等领域的服务提供商沉淀了海量业务数据,基于海量业务数据,挖掘不同业务实体(实体)之间的关系成为数据挖掘领域一个重要的技术研究方向。而随着机器处理能力的提升,越来越多技术人员开始研究如何通过机器学习技术进行挖掘。
本发明的发明人发现:目前,通过机器学习技术,对海量业务数据进行学习,得到用于表达实体及实体之间关系的图(Graph),即,对海量业务数据进行图学习,成为一个优选的技术方向。简单理解,图由节点和边构成,图中的每个序号代表一个节点,一个节点用于表示一个实体,节点与节点之间的边用于表示节点之间的关系。一张图一般会包括两个以上的节点和一条以上的边,因此,图也可以理解为由节点的集合和边的集合组成,通常表示为:G(V,E),其中,G表示图,V表示图G中节点的集合,E是图G中边的集合。图可以分为同构图和异构图,其中,异构图指的是一张图中的节点的类型不同(边的类型可以相同或者不同),或者一张图中边的类型不同(节点的类型可以相同或者不同)。图1所示则为一张异构图,同样类型的边用同样的线形表示,同样类型的点用同样的几何图形表示。
图卷积网络(GCN,Graph Convolution Network)是一种有效的图表征的学习方法,在很多关键任务上取得了超过以往的方法的效果。
为了获取图中每个节点的表征向量,图卷积网络通常的做法是对于每个节点聚合其邻居节点的表征向量(表征向量通常是需要训练的GCN各节点的属性特征值),进而得到更高一层节点的结果,依次进行层迭代计算。
容易看到此类方法的计算量随着层数的增多而指数级递增,随着应用的深入,对于节点数量庞大的图来说,可导致模型的整体训练时间不可接受。
高昂的计算力的需求增加了GCN模型训练的时间,制约了GCN模型在各种实际应用例如搜索、广告投放、推荐、社交网络挖掘等方面中的应用。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于图的卷积网络训练方法、装置及系统。
第一方面,本发明实施例提供一种基于图的卷积网络训练方法,包括:
根据预定义的图中的节点个数和预设的卷积模型层数,为卷积模型除了最低层和最高层之外的每一层建立第一存储空间,每个第一存储空间与一个节点标识对应且用于存储所述节点的特征向量;
基于每个批次的训练数据和所述图,确定所述训练数据的各中心节点的标识及所述中心节点的各邻居节点标识;
针对每个中心节点,从前一层所述中心节点的各邻居节点标识对应的第一存储空间中获取所述各邻居节点的表征向量;
根据前一层传递来的所述中心节点的表征向量及获取到的所述各邻居节点的表征向量,确定所述中心节点在本层中的表征向量,当当前层并非最低层或者最高层时,将确定出的表征向量传递至本层相邻的下一层并更新本层第一存储空间中所述中心节点标识对应的表征向量;
直至得到所述中心节点在最高层的表征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910041725.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电极组件及次氯酸钠生成器
- 下一篇:一种用于牙齿增白的口香糖