[发明专利]基于会话推荐系统的用户偏好预测方法有效
申请号: | 202011099165.0 | 申请日: | 2020-10-14 |
公开(公告)号: | CN112364976B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 袁晓洁;叶承卫 | 申请(专利权)人: | 南开大学 |
主分类号: | G06Q30/0202 | 分类号: | G06Q30/0202;G06N3/042;G06N3/0499;G06N3/084;G06Q30/0601 |
代理公司: | 合肥晨创知识产权代理事务所(普通合伙) 34162 | 代理人: | 康培培 |
地址: | 300350 天津市津南区海*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 会话 推荐 系统 用户 偏好 预测 方法 | ||
1.基于会话推荐系统的用户偏好预测方法,其特征在于,包括以下步骤,
S1,读取匿名会话数据,并进行预处理,得到会话序列训练测试集;
所述步骤S1具体包括,
S1.1,对原始会话数据进行过滤,
原始的会话序列,包含了多个匿名用户的交互序列,每个交互序列是用户与物品的交互,记录形式为物品的编号,过滤行为将过滤掉会话长度短的会话,以及在数据集中出现次数少于阈值的物品;
S1.2,对原始会话数据进行生成训练测试集,
过滤数据后,通过将每个会话序列,按照最左原则生成多个子序列,每个子序列和他后面的一个值构成一个训练数据,具体来说,一个会话序列定义如下:
s=[ss,1,ss,2,…,ss,t]
其中ss,i是第i个物品的id并且t表示当前会话的长度,属于这个序列S中的每个物品都属于物品总集合V={v1,v2,…,v|N|},
生成训练测试集合的时候,采取如下方式:
({ss,1},ss,2),({ss,1,ss,2},ss,3),…,({ss,1,…,ss,t-1},ss,t)
一个会话序列S将被拆分为t-1个训练测试集;
S2,根据步骤S1得到的会话序列构建有向带权图;
所述步骤S2将根据步骤S1得到的会话数据输入模型构建会话图,将会话中的每个物品表示为图中一个顶点,图上的有向边表示为物品之间的交互,权值为交互次数,
S2.1,顶点映射
将每个物品映射为图中的一个顶点vs,i,其中,同样的物品会被映射为同一个顶点,因此图中顶点数将小于等于会话物品数;
S2.2,边映射
在一个长度为t的会话序列S中,t-1个元组(vs,i-1,vs,i)将被生成,其中每个元组表示在会话序列S中用户在点击vs,i前先点击了vs,i-1;
S2.3,权值映射
在会话中可能会有重复项,因此会造成冗余元组,冗余元组(vs,p,vs,q)暗示了vs,p后出现vs,q的频率高,将元组的出现次数定义为这两个节点之间的权重wp,q;
S3,基于有向带权图,基于图神经网络学习图中每个顶点的向量表示;所述步骤S3具体包括以下步骤,
S3.1,GNN函数
GNN网络的目标是学习一个映射函数f,来生成顶点v的向量表示;
S3.2,GAT-EW网络实现
系数矩阵,定义如下:
AGAT-EW(G)=[aij]t×t
其中aij是通过自注意机制计算出来的,表示了顶点i到顶点j的重要性,
在第一阶段,注意力系数eij会通过注意力函数Attn被计算出来如下:
eij=Attn(Wxi,Wxj)
再通过一个sofrmax函数和LeakyReLU激活函数得到αij,
其中||表示两个向量的连接操作,在上述操作后,在不同顶点间正则化后的注意力系数被得到,GAT-EW为每个顶点预测输出值如下:
其中wij表示了顶点i到j的权重;
S4,基于自注意网络和池化层分别获取用户的长期和短期偏好;
S5,运用注意力机制自动学习长期偏好和短期偏好各自的重要性,结合他们完成预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011099165.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于钢材切割的智能制造装置
- 下一篇:一种SATA NCQ命令调度方法