[发明专利]一种图构建与L1正则矩阵分解联合学习的推荐方法在审
申请号: | 201710568429.4 | 申请日: | 2017-07-13 |
公开(公告)号: | CN107451855A | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 杨明;陶昀翔;吕静 | 申请(专利权)人: | 南京师范大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 南京经纬专利商标代理有限公司32200 | 代理人: | 姜慧勤 |
地址: | 210023 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 构建 l1 正则 矩阵 分解 联合 学习 推荐 方法 | ||
技术领域
本发明涉及一种图构建与L1正则矩阵分解联合学习的推荐方法,属于推荐学习技术领域。
背景技术
目前,已有的推荐技术包括基于内容的推荐、协同过滤推荐等。基于内容的推荐算法,是根据用户的一些历史信息构建用户偏好信息,计算推荐项目与用户偏好的相似度,将相似度高的项目推荐给用户。协同过滤算法可以分为基于邻域的协同过滤算法和矩阵分解算法。基于近邻的协同过滤推荐算法包括基于用户的协同过滤推荐算法和基于项目的协同过滤算法。矩阵分解是通过降维的方法将评分矩阵补全,这类推荐算法将用户、物品的特征转换为隐语义的特征,然后再通过计算用户和物品之间隐语义的相关性进行推荐。
矩阵分解推荐的目标就是预测出问号符号对应位置的分值。推荐系统基于这样一个假设:用户对项目的打分越高,表明用户越喜欢。因此,预测出用户对未评分项目的评分后,根据分值大小排序,把分值高的项目推荐给用户。矩阵分解具有准确性高,可扩展性好等优点,如基于流形正则化的矩阵分解的推荐算法,考虑了输入样本的局部相似性和流形结构,可以提高推荐质量。
然而,传统的协同过滤方法会受到来自数据稀疏性的影响,在基于用户和物品的协同过滤算法中,如何度量用户及物品间的相似性是其关键环节,相似性是否有效直接影响推荐算法的性能;在基于流形正则化的矩阵分解的推荐算法中,由于数据稀疏性或标签信息的不完整性,基于稀疏评分或不完整的标签计算所得到的近邻图(相似度)可能未必有效,而且这种邻域图是局部的构图,导致了参数选择的困难(如选择邻域的大小),无效的图在学习任务中固定不变会产生一个不好的推荐。
发明内容
本发明所要解决的技术问题是:提供一种图构建与L1正则矩阵分解联合学习的推荐方法,该方法将相似度边权作为参数通过迭代优化不断修正,可以有效地解决评分数据的稀疏性问题。
本发明为解决上述技术问题采用以下技术方案:
一种图构建与L1正则矩阵分解联合学习的推荐方法,包括如下步骤:
步骤1,根据用户对物品的评分数据,构建评分矩阵,其中,评分矩阵的行数为用户总数,列数为物品总数;
步骤2,在L1正则矩阵分解模型的基础上,将图边权作为未知变量嵌入到该模型的目标函数中,建立新的分解模型;新的分解模型为:
sij≥0,j∈N(i)
其中,m表示用户总数,n表示物品总数,当用户u对物品i进行了评分行为,那么Iui表示为1,否则Iui表示为0;rui表示用户u对物品i的评分值,pu、qi、qj分别为用户u、物品i、物品j的隐语义特征向量,pu表示矩阵P的第u个列向量,qi表示矩阵Q的第i个列向量,且评分矩阵R=PTQ,λ1、λ2表示正则化参数,λ3控制图边权的光滑性,N(i)表示物品i的近邻集合,k表示物品i的近邻个数,sij表示物品i与物品j之间的相似度,即图边权;S表示物品间相似度矩阵;|| ||1表示1范数,|| ||表示2范数;
步骤3,基于标签或评分或主题空间计算物品间的初始相似度,并用图来刻画初始相似度,得到初始图边权;
步骤4,随机初始化新的分解模型中待求解的用户u、物品i的隐语义特征向量pu、qi以及物品i与物品j之间的相似度sij;
步骤5,基于初始图边权,利用OWL-QN算法自适应更新新的分解模型中的参数pu、qi、sij,得到完整的评分矩阵,根据完整的评分矩阵为用户进行物品推荐。
作为本发明的一种优选方案,步骤3所述基于标签计算物品间的初始相似度,计算公式为:
其中,sij表示物品i与物品j之间的相似度,即图边权;li、lj分别物品i、物品j标签的数值向量,|| ||表示2范数。
作为本发明的一种优选方案,步骤3所述基于评分计算物品间的初始相似度,计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京师范大学,未经南京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710568429.4/2.html,转载请声明来源钻瓜专利网。