[发明专利]基于浅层自动编码器模型的推荐方法、系统、设备及介质有效
| 申请号: | 202310453939.2 | 申请日: | 2023-04-25 |
| 公开(公告)号: | CN116166890B | 公开(公告)日: | 2023-07-18 |
| 发明(设计)人: | 连德富;陈恩红;范睿 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N20/00;G06N5/04;G06Q30/0601 |
| 代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 韩珂;郑立明 |
| 地址: | 230026 安*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 自动 编码器 模型 推荐 方法 系统 设备 介质 | ||
本发明公开了一种基于浅层自动编码器模型的推荐方法、系统、设备及介质,它们是一一对应的方案,方案中:引入稀疏矩阵可以降低数据的存储空间,并提升工作效率,引入控制正样本的重要性的超参数能从有限的正样本中学到更多知识,从而提升物品推荐效果,同时,通过交替训练的方式可以在获得最优超参数的同时获得最优模型参数,最优模型参数可以准确的表征物品之间相似度,从而更准确的预测用户对所有物品的评分,能够进一步提升物品推荐效果。
技术领域
本发明涉及物品推荐技术领域,尤其涉及一种基于浅层自动编码器模型的推荐方法、系统、设备及介质。
背景技术
为了解决互联网世界中日益严重的信息过载问题,人们建立推荐系统来预测用户偏好。作为存在最广泛且最易收集的用户行为,浏览、点击等隐式反馈通常被直接用作模型训练的元数据。基于隐式反馈的推荐解决这类问题,它旨在根据用户的历史浏览/点击序列,为用户提供一个物品的排序列表,使用户喜欢的物品尽可能在列表的头部。目前,已经有许多方法在这个领域中被提出,可以大致被分为两类。第一大类是线性模型方案,此类模型只通过数据的线性计算就可以得到用户对物品的预测分数。其中还可以被分为两小类。第一小类是隐向量模型,即每一个用户和物品都有一个短向量来标识其自身,向量中包含用户或物品的特性;第二小类是邻居模型,即用户对物品的打分是基于该用户的邻居用户打分或者该物品的邻居物品得分所计算出来的,如何计算用户或物品的邻居、邻居间的相似度是可变的。由于模型的线性特征,此大类方法通常采用推导闭式解的方式进行求解,结果十分直观。但由于存在大矩阵的变换,其严重依赖于机器的计算和存储能力,且推荐的准确度不佳。第二大类是深度模型,此类模型,将用户的物品交互记录作为模型的输入,通过一系列线性或非线性的变换得到最终的得分,深度模型的结构在不同的方法中各不相同,如自动编码器、多层感知机等。
EASE是一种典型的浅层自动编码器模型(Steck H. Embarrassingly shallowautoencoders for sparse data[C]//The World Wide Web Conference. 2019: 3251-3257)。其主要学习一个大小为N×N的稠密矩阵,N为物品数量。通过优化评分的平方损失,稠密矩阵的闭式解可以被显式地求解出来。但是:(1)模型参数的求解需要计算大矩阵的逆,当物品数量(N)增多时,求解所需要的时间和空间成指数增长;(2)由于数据集非常稀疏,若过少的正样本(即用户交互的物品)并未得到额外的重视,可能会导致正样本对模型的指导意义明显减弱。其中,正样本指的是在数据集中,与用户交互过的物品集合,也就是物品交互记录为1的所有物品;所述物品包括:短视频平台中的视频、购物平台中的各类商品(例如,服饰)等。(3)模型对超参数的值非常敏感,但寻找更优的超参数组合是繁琐低效的事情。基于以上三个原因,导致现有EASE方案不仅耗时,更重要的是,它的性能不佳,导致推荐效果不够理想。
有鉴于此,特提出本发明。
发明内容
本发明的目的是提供一种基于浅层自动编码器模型的推荐方法、系统、设备及介质,可以提升工作效率,减少存储空间,提升物品推荐效果。
本发明的目的是通过以下技术方案实现的:
一种基于浅层自动编码器模型的推荐方法,包括:
收集多个用户的物品交互记录数据,并按照设定比例进行随机划分后,取出两部分称为训练集与验证集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310453939.2/2.html,转载请声明来源钻瓜专利网。





