[发明专利]图神经网络模型的训练方法及装置有效
申请号: | 202110291393.6 | 申请日: | 2021-03-18 |
公开(公告)号: | CN113139654B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 杨玉基;张梦迪;张富峥 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/042;G06F18/22 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 任亚娟 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 模型 训练 方法 装置 | ||
本公开提供了一种图神经网络模型的训练方法及装置。所述方法包括:根据网络节点和网络节点的历史交互数据,构建节点交互图;根据图节点之间的连接边权重,计算任意两个网络节点的节点相似度;根据节点相似度和网络节点构建训练样本图;对训练样本图进行采样处理得到多个样本子图;获取样本子图的负样本节点和多阶邻居节点;根据样本子图、负样本节点和多阶邻居节点对初始图神经网络模型进行训练,得到损失值;在损失值处于预设范围内的情况下,将训练后的初始图神经网络模型作为目标图神经网络模型。本公开可以在保证生成节点向量的可解释性的同时,提高生成的节点向量的质量。
技术领域
本公开的实施例涉及模型训练技术领域,尤其涉及一种图神经网络模型的训练方法及装置。
背景技术
Embedding(嵌入)技术的主要目的是使机器学习到词语的分布式表示,从而达到将词语空间降维的目的。embedding的概念逐渐被扩展到其他领域,已经成为许多应用和业务(如搜索推荐等)的基础组成部分。
随着高效向量检索技术的成熟,embedding在搜索推荐等应用中扮演着越来越重要的角色。现有的embedding生成技术主要分为以下几类:
1、基于序列模型,将原始数据构造成多个item(如商家、商品等)的序列,上下文越相似的item,生成的embedding越相似;
2、基于协同过滤,将user(用户)和item按照点击关系建立二部图矩阵,矩阵分解后,得到user和item的embedding,在二部图中邻居越相似的节点的embedding越相似;
3、基于双塔模型,将user侧和item侧所有特征分别作为两个输入,分别经过多个非线性层进行特征抽取后,得到user和item的向量vu和vi。训练过程中将vu和vi的余弦距离和正例负例标签之间的差值作为损失函数。
在上述生成embedding的方法中,协同过滤和序列模型的方式,由于交互行为分布十分不均衡,热门item的学习到的embedding较好,冷门item学习到的embedding效果则较差,而往往冷门item的数量占比较大,从而限制了线上效果。而双塔模型则无法清晰的解释这两个item(如A和B)相似度的相比于另外两个item(如A和C)的相似度更大,可解释性较差。
发明内容
本公开的实施例提供一种图神经网络模型的训练方法及装置,用以在保证生成节点向量的可解释性的同时,提高生成的节点向量的质量,从而提升下游相似性等任务的效果。
根据本公开的实施例的第一方面,提供了一种图神经网络模型的训练方法,包括:
根据网络节点和所述网络节点对应的历史交互数据,构建节点交互图;所述节点交互图中以所述网络节点和所述网络节点对应的用户作为图节点;
根据所述图节点之间的连接边权重,计算所述节点交互图中任意两个所述网络节点之间的节点相似度;
根据所述节点相似度和所述网络节点,构建得到训练样本图;
对所述训练样本图进行采样处理,得到多个以所述网络节点为主节点的样本子图;
获取所述样本子图对应的负样本节点和多阶邻居节点;
根据所述样本子图、所述负样本节点和所述多阶邻居节点对初始图神经网络模型进行训练,得到所述初始图神经网络模型的损失值;
在所述损失值处于预设范围内的情况下,将训练后的初始图神经网络模型作为目标图神经网络模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110291393.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种标定方法、装置、电子设备及存储介质
- 下一篇:云演唱会系统及观看方法