[发明专利]一种基于卷积自注意力网络的会话推荐方法有效
申请号: | 202010969069.0 | 申请日: | 2020-09-15 |
公开(公告)号: | CN112258262B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 张寅;汪千缘 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06Q30/0601 | 分类号: | G06Q30/0601;G06Q30/0202;G06N3/0464;G06N3/048 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 傅朝栋;张法高 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 注意力 网络 会话 推荐 方法 | ||
本发明公开了一种基于卷积自注意力网络的会话推荐方法。本发明包括如下步骤:1)先将会话内每个物品表示成低维向量,该低维向量由物品嵌入和位置嵌入相加而成;2)对低维向量进行序列建模和意图建模,序列建模捕捉会话的序列信息,意图建模捕捉会话的关键意图信息;3)基于得到的拼接序列信息和关键意图信息,有选择地预测用户下一步点击重复物品或不重复物品。和现有技术相比,首先,本发明可以捕捉会话内不同片段之间的相互依赖,得到会话片段敏感的物品表示。然后,本发明使用双向线性解码器,降低了模型的参数量并提升模型的性能和鲁棒性。最后,本发明使用高斯偏移改进注意力层,计算高斯权重因子,以此来提升重复推荐解码器的性能。
技术领域
本发明涉及神经网络方法在会话推荐技术上的应用,尤其涉及采用卷积操作捕捉会话局部片段特征和采用高斯偏移丰富权重因子信息量的技术方法。
背景技术
大数据时代背景下,“信息过载”是一个常见的问题。如何从纷繁复杂的数据中获取有价值的信息,是大数据技术发展的关键难题。推荐系统(Recommender Systems,简称RS)是解决信息过载的有效方法。推荐系统指的是,通过利用消费者与网站的历史交互信息,对消费者及其交互信息进行建模,挖掘消费者兴趣爱好,进而对海量选择进行过滤、评估,最终为消费者进行个性化推荐的技术系统。
传统的个性化推荐系统往往需要掌握用户信息来进行特色化推荐。但是许多电子商务推荐系统(尤其是小型零售商的系统)和大多数新闻和媒体网站通常不会跟踪长时间访问其网站的用户身份。虽然浏览器缓存可以提供一定信息,辅助网站对用户的识别和画像,但这些技术往往不够可靠,而且有可能涉及隐私问题。会话根据一段时间内的匿名行为序列(如点击、购买、收藏、加购物车等),预测用户的下一步行为。这样的匿名行为序列,本发明称为“会话”。会话内的行为,本发明称为“物品”。
近些年,循环神经网络、自注意力网络等深度学习技术被成功应用于会话推荐算法中。相较于循环神经网络(RNN),自注意力网络(SAN)在建模长期依赖、避免信息遗忘方面有明显优势,但现有模型仍然存在三个问题:
1)忽略了局部相关性。局部相关性指的是会话内不同序列片段之间的相互依赖。序列片段是比单个物品更加抽象的特征单位。在建模物品时捕捉局部相关性,能得到更好的物品表示,提升预测的准确度。
2)常规的全连接解码器参数量巨大,训练时间长,模型鲁棒性差。
3)忽略了会话内物品被点击的先后顺序对重复推荐结果的影响。在重复消费现象中,用户下一时刻点击的物品更有可能是最近点击过的物品。
发明内容
本发明的目的是解决现有技术中存在的问题,并提供一种基于卷积自注意力网络的会话推荐方法。本发明使用基于卷积自注意力网络的编码器捕捉会话中的局部相关性,得到会话片段敏感的物品表示,提升建模会话的性能。本发明利用双向线性解码器降低模型的参数量,提升模型的性能和鲁棒性。本发明利用高斯权重建模会话内各物品与最后一个物品之间的距离远近关系,提升了重复推荐解码器的性能。
本发明具体采用的技术方案如下:
一种基于卷积自注意力网络的会话推荐方法,其步骤如下:
S1:给定一个会话作为输入,获取会话内每个物品的低维向量,该低维向量由物品嵌入和物品在会话中的位置嵌入相加而成;
S2:在S1获得的低维向量基础上,使用基于卷积自注意力网络的序列编码器建模会话的序列信息,使用基于卷积自注意力网络和高斯注意力机制的意图编码器建模会话的关键意图信息并计算高斯权重;
S3:拼接S2中得到的序列信息和关键意图信息得到会话隐层表示,输入到重复-探索选择器中预测用户下一步选择重复或不重复物品的概率;然后在重复推荐解码器中计算各重复物品的条件概率,在探索推荐解码器中计算各不重复物品的条件概率,两种解码器输出的边缘概率相加,得到模型对所有可能物品的预测概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010969069.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种三维实景融合建模的方法
- 下一篇:退镀方法以及退镀装置