[发明专利]基于会话推荐系统的用户偏好预测方法有效

申请号：	202011099165.0	申请日：	2020-10-14
公开（公告）号：	CN112364976B	公开（公告）日：	2023-04-07
发明（设计）人：	袁晓洁;叶承卫	申请（专利权）人：	南开大学
主分类号：	G06Q30/0202	分类号：	G06Q30/0202;G06N3/042;G06N3/0499;G06N3/084;G06Q30/0601
代理公司：	合肥晨创知识产权代理事务所(普通合伙) 34162	代理人：	康培培
地址：	300350 天津市津南区海***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于会话推荐系统用户偏好预测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于会话推荐系统的用户偏好预测方法，其特征在于，包括以下步骤，

S1，读取匿名会话数据，并进行预处理，得到会话序列训练测试集；

所述步骤S1具体包括，

S1.1，对原始会话数据进行过滤，

原始的会话序列，包含了多个匿名用户的交互序列，每个交互序列是用户与物品的交互，记录形式为物品的编号，过滤行为将过滤掉会话长度短的会话，以及在数据集中出现次数少于阈值的物品；

S1.2，对原始会话数据进行生成训练测试集，

过滤数据后，通过将每个会话序列，按照最左原则生成多个子序列，每个子序列和他后面的一个值构成一个训练数据，具体来说，一个会话序列定义如下：

s＝[s_s,1,s_s,2,…,s_s,t]

其中s_s,i是第i个物品的id并且t表示当前会话的长度，属于这个序列S中的每个物品都属于物品总集合V＝{v₁,v₂,…,v_|N|}，

生成训练测试集合的时候，采取如下方式：

({s_s,1},s_s,2),({s_s,1,s_s,2},s_s,3),…,({s_s,1,…,s_s,t-1},s_s,t)

一个会话序列S将被拆分为t-1个训练测试集；

S2，根据步骤S1得到的会话序列构建有向带权图；

所述步骤S2将根据步骤S1得到的会话数据输入模型构建会话图，将会话中的每个物品表示为图中一个顶点，图上的有向边表示为物品之间的交互，权值为交互次数，

S2.1，顶点映射

将每个物品映射为图中的一个顶点v_s,i，其中，同样的物品会被映射为同一个顶点，因此图中顶点数将小于等于会话物品数；

S2.2，边映射

在一个长度为t的会话序列S中，t-1个元组(v_s,i-1,v_s,i)将被生成，其中每个元组表示在会话序列S中用户在点击v_s,i前先点击了v_s,i-1；

S2.3，权值映射

在会话中可能会有重复项，因此会造成冗余元组，冗余元组(v_s,p,v_s,q)暗示了v_s,p后出现v_s,q的频率高，将元组的出现次数定义为这两个节点之间的权重w_p,q；

S3，基于有向带权图，基于图神经网络学习图中每个顶点的向量表示；所述步骤S3具体包括以下步骤，

S3.1，GNN函数

GNN网络的目标是学习一个映射函数f，来生成顶点v的向量表示；

S3.2，GAT-EW网络实现

系数矩阵，定义如下：

A_GAT-EW(G)＝[a_ij]_t×t

其中a_ij是通过自注意机制计算出来的，表示了顶点i到顶点j的重要性，

在第一阶段，注意力系数e_ij会通过注意力函数Attn被计算出来如下：

e_ij＝Attn(Wx_i,Wx_j)

再通过一个sofrmax函数和LeakyReLU激活函数得到α_ij，

其中||表示两个向量的连接操作，在上述操作后，在不同顶点间正则化后的注意力系数被得到，GAT-EW为每个顶点预测输出值如下：

其中w_ij表示了顶点i到j的权重；

S4，基于自注意网络和池化层分别获取用户的长期和短期偏好；

S5，运用注意力机制自动学习长期偏好和短期偏好各自的重要性，结合他们完成预测。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南开大学，未经南开大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011099165.0/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载