[发明专利]基于交互序列数据挖掘深度用户相似性的推荐方法有效
申请号: | 201811224350.0 | 申请日: | 2018-10-19 |
公开(公告)号: | CN109522474B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 徐亚南;朱燕民;沈艳艳;俞嘉地 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/2458;G06Q30/06 |
代理公司: | 上海思微知识产权代理事务所(普通合伙) 31237 | 代理人: | 屈蘅 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 交互 序列 数据 挖掘 深度 用户 相似性 推荐 方法 | ||
本发明提供了一种基于交互序列数据挖掘深度用户相似性的推荐方法,所述推荐方法包括对用户与物品交互的原始记录数据进行预处理,以获得用户与物品的交互序列数据,并根据所述交互序列数据生成用户‑物品交互矩阵和用户‑gram矩阵;根据所述用户‑物品交互矩阵和所述用户‑gram矩阵构建推荐模型,并训练所述推荐模型;基于经过训练的推荐模型,计算出每个用户对所有物品的偏好,并根据偏好值由高到低对所有物品进行排序;去除用户已交互过的物品,将剩余物品中预定个偏好值最高的物品作为个性化推荐的结果推荐给对应用户。本发明将用户对物品的偏好情况和用户间的相似性应用于推荐方法中,解决了数据稀疏性的问题,提高了推荐准确率。
技术领域
本发明涉及互联网技术领域,特别涉及一种基于交互序列数据挖掘深度用户相似性的推荐方法。
背景技术
随着互联网的发展,人们正面临着信息爆炸的问题。一方面,大量的信息能够为人们提供了更多的选择,例如人们可以选择自己喜欢的电影。但是另一方面,太多的信息会花费人们大量的时间在互联网上进行搜索和选择。因此推荐系统作为可以解决信息过载的一种方法,就显得尤其重要,而且推荐系统已经被很多在线服务所广泛采用,如在线的音乐、视频、电商、社交网络等。建立个性化推荐系统的关键在于根据用户的偏好,对每个用户推荐少量的物品。在推荐领域,最受欢迎的方法是基于用户对物品评分矩阵的协同过滤方法。但是显式的评分很难获得,这会导致训练数据稀疏的问题。为了解决这个问题,很多研究人员开始根据用户和物品的交互记录抽取隐式反馈,如点击、查看、下载等。基于隐式反馈,构建用户-物品的交互矩阵,然后应用协同过滤的方法进行推荐。然而,这种用户-物品的交互矩阵只记录了用户和物品的交互次数,丢失了原始交互序列记录里包含的物品依赖关系、用户相似性等信息。
为了利用序列数据进行物品推荐,很多研究都提出了一个假设,即用户下一个要交互的物品依赖于前n-1个交互的物品。例如,马尔科夫链假设下一个交互的物品只依赖于前一个物品,利用序列数据学习获得物品之间的转移概率矩阵。最新的研究是根据序列数据为每个物品学习低维的向量表达,这些向量可以用来计算物品之间的相似性。这些方法都是基于物品在序列数据中的依赖关系进行建模推荐物品的。但是,这些方法的目标往往依赖于上一个物品作为模型输入。如果两个记录之间的时间间隔比较大,则这些方法的前提假设,即物品之间的依赖关系,有可能失效。另外一个缺陷是,这些方法只考虑了物品之间的依赖性,没有根据序列数据研究用户相似性的工作。
针对现有的个性化推荐系统存在的不足,本领域技术人员一直在寻找解决的方法。
发明内容
本发明的目的在于提供一种基于交互序列数据挖掘深度用户相似性的推荐方法,以解决使用现有技术中个性化推荐系统存在的不足。
为解决上述技术问题,本发明提供一种基于交互序列数据挖掘深度用户相似性的推荐方法,所述基于交互序列数据挖掘深度用户相似性的推荐方法包括:
对用户与物品交互的原始记录数据进行预处理,以获得用户与物品的交互序列数据,并根据所述交互序列数据生成用户-物品交互矩阵和用户-gram矩阵;
根据所述用户-物品交互矩阵和所述用户-gram矩阵构建推荐模型,并训练所述推荐模型;
基于经过训练的推荐模型,计算出每个用户对所有物品的偏好,并根据偏好值由高到低对所有物品进行排序;
去除用户已交互过的物品,将剩余物品中预定个偏好值最高的物品作为个性化推荐的结果推荐给对应用户。
可选的,在所述的基于交互序列数据挖掘深度用户相似性的推荐方法中,所述对用户与物品交互的原始记录数据进行预处理,以获得用户与物品的交互序列数据的过程如下:
将每个用户与物品交互的原始记录数据转换成n-gram,根据n-gram挖掘用户的相似性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811224350.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置