[发明专利]基于图卷积网络的两阶段协同过滤多行为推荐方法在审
申请号: | 202210854928.0 | 申请日: | 2022-07-19 |
公开(公告)号: | CN115357804A | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 孙静;严明时;程志勇;王法胜;孙福明 | 申请(专利权)人: | 大连民族大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06N3/04;G06N3/08 |
代理公司: | 沈阳利泰专利商标代理有限公司 21209 | 代理人: | 吴维敬 |
地址: | 116600 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图卷 网络 阶段 协同 过滤 行为 推荐 方法 | ||
1.基于图卷积网络的两阶段协同过滤多行为推荐方法,其特征在于包括下列步骤:
定义U和I分别代表用户和物品的集合,其中u(i)代表集合U(I)中第i个用户(物品);R={R1,…,Rk…,RK}表示所有K种行为下的用户-物品的交互矩阵的集合,其中RK为目标行为的交互矩阵;总的交互矩阵RG=R1∪…∪RK;具体来说,交互矩阵是二值矩阵,当用户u和物品i发生过交互时,否则其中是第k个行为的交互矩阵的第u行i列元素;
所研究问题的表述如下:
输入:用户集U,物品集合I,不同行为交互矩阵集合R,总交互矩阵RG;
输出:用户u在目标行为下和物品i发生交互的可能性。
2.根据权利要求1所述的基于图卷积网络的两阶段协同过滤多行为推荐方法,其特征在于包括下列步骤:
本方法的模型:
通过充分利用所有交互数据来设计模型,以对用户偏好进行由整体到局部的捕获,从而挖掘不同行为间的联系,进而提升推荐系统的性能;模型分为两个学习阶段;第一阶段用于捕获局部细化后的不同行为下用户偏好,第二阶段用于探索不同行为间的联系;在第一阶段中,先对所有行为的交互数据取并集构成一个新的二分图,以捕获用户的全局偏好;然后再利用各自行为的交互数据组成的二分图来对全局偏好进行局部细化,以得到不同行为中反映出来的局部细化后的用户偏好;在第二阶段中,先提取所有可能导致目标行为发生的用户偏好,然后将其拼接融合,从而提升对目标行为的预测能力。
3.根据权利要求2所述的基于图卷积网络的两阶段协同过滤多行为推荐方法,其特征在于包括下列步骤:具体过程为:
嵌入向量初始化:
将每个用户和物品的ID与Embedding(嵌入向量)相关联.具体来说,令P∈RM×d和Q∈RN×d分别作为用户和物品的初始化Embedding,其中M(N)表示用户(物品)的总数,d为Embedding的长度.给定用户以及物品ID的独热编码矩阵IDU和IDI,用户u和物品i表示为:
其中,eu(ei)为用户u(物品i)的Embedding表示,为用户u(物品i)的独热编码;
各行为用户偏好的捕获:
第一阶段包含两个步骤,第一步是从由所有行为交互数据构造的二分图中学得用户的全局偏好;第二步是在由不同行为交互数据分别组成的二分图中对全局偏好进一步细化,以得到细化后的用户偏好;
利用GCN领域聚合模块来聚合邻居节点的信息;用于更新用户节点的邻域聚合公式如下:
eu=AGG({ei:i∈Nu}) (2)
其中AGG表示聚合函数,用于聚合与用户u相邻节点的信息;ei表示二分图中与用户u相邻物品的表示;eu是通过邻域聚合得到的用户表示;Nu表示图中与用户u有过交互的物品集合;聚合后的物品的表示ei,聚合函数采用的是标准邻域聚合:
其中是对称归一化系数,遵循了标准GCN的设计;和分别表示聚合后的用户和物品的表示;|Nu|(|Ni|)定义为用户u(物品i)在二分图中所代表的节点的度;
在第一步中,首先将总的交互矩阵RG构造成用户和物品总的二分图;然后根据公式(3)计算得到聚合(不包含自连接)后的用户和物品表示和最后,将其与聚合之前的eu和ei相融合,以保留原有的特征信息;为了降低由邻域聚合导致的某些特征数量级的变化而带来的影响,本技术方案对和进行了L2正则化处理;融合后的表示分别为:
其中表示逐元素相加,||·||2是L2正则化,和分别表示第一步输出的用户和物品的表示;
在第二步中,首先将第一步得到的和作为各行为二分图的共享输入,这些二分图是根据各行为的交互矩阵{R1,…,Rk…,RK}所构成的;然后采用与第一步相同的方法,即根据公式(3)和公式(4)可以得到各个行为细化后的用户以及物品的表示和
不同行为间联系的挖掘:
为了将除目标行为外局部细化的用户偏好用于目标行为的预测,首先需要对这些偏好进行过滤,寻找出可能导致目标行为发生的偏好;然后再将这些偏好融合起来实现不同偏好的组合,从而提升目标行为的预测能力;
基于上述讨论,第二阶段同样分两步来实现;第一步先从细化后的不同行为的表示中过滤出可能导致目标行为发生的偏好;此步骤采用线性变换来实现:
其中W1U∈Rd×d和W1I∈Rd×d为行为1的参数矩阵,B1U∈Rd×1和B1I∈Rd×1是行为1的偏置,d表示Embedding的长度;根据公式(5),最终可以得到从不同行为中过滤出的用户和物品的表示和
然后,第二步将各行为过滤后得到的表示与目标行为的表示进行拼接融合;首先,对第一步得到的过滤后的偏好进行拼接:
其中||表示拼接操作;然后经过线性变换得到融合后的最终用户和物品的表示:
其中和表示参数矩阵,和表示偏置,K为行为的数量;
通过第二阶段的设计,实现了对从不同行为中捕获到的用户和物品表示的融合,并得到了最终的用户和物品的表示和将其用于目标行为的预测;
目标函数与模型训练:
采用计算内积的方法来获得交互得分:
在本技术方案训练过程中,需要保证交互过的用户-物品的得分高于未交互过的用户-物品得分,即:
其中σ(·)表示Sigmoid函数;O={(u,i,j)|(u,i)∈R+,(u,j)∈R-}表示正负样本对;R+(R-)代表在训练集中出现(未出现)的用户-物品交互对的集合;即根据(u,i)获取交互矩阵中对应位置为1的用户u和物品i的表示eu和ei,根据(u,j)获取交互矩阵对应位置为0的用户u和物品j的表示eu和ej;基于以上讨论,可以分别得到两个阶段的目标函数;
经过第一阶段的学习可以得到各行为用户和物品表示的集合和以第一个行为为例,利用其交互矩阵R1作为训练集,其目标函数为:
得到第一阶段最终的总目标函数:
其中β为超参数;Θ1是可训练参数;
在第二阶段中,通过利用用目标行为的交互矩阵RK来进行训练,得到最终用户与物品的表示和其目标函数为:
其中Θ2代表第二阶段学习过程中的所有参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连民族大学,未经大连民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210854928.0/1.html,转载请声明来源钻瓜专利网。