[发明专利]基于综合相似度迁移的协同过滤方法有效
申请号: | 201810050004.9 | 申请日: | 2018-01-18 |
公开(公告)号: | CN108269172B | 公开(公告)日: | 2020-02-18 |
发明(设计)人: | 琚生根;孙界平;陈黎;夏欣;金玉;王婧研 | 申请(专利权)人: | 四川大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06N99/00 |
代理公司: | 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 | 代理人: | 何健雄 |
地址: | 610041 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 综合 相似 迁移 协同 过滤 方法 | ||
本发明公开了一种基于综合相似度迁移的协同过滤方法,与现有技术相比,本发明在相似度计算上,即利用了用户评分信息同时也利用了用户属性信息,并且考虑了用户间对满意度的打分标准的差异性,采用了用户评分分布一致性来衡量用户评分相似度的方法,提高了相似度计算的准确性,从而提高了数据迁移的质量。实验结果表明,该模型较其他方法能比较有效地缓解数据稀疏性问题。未来可以考虑联合项目相似度或其他知识,如文本信息,对辅助领域的数据进行迁移,通过这种方式可以提高迁移数据的质量,从而提高推荐精确度。
技术领域
本发明涉及网络信息计算领域,尤其涉及一种基于综合相似度迁移的协同过滤方法。
背景技术
当前,网络信息量呈指数级增长,网络用户一方面可获取丰富信息,另一方面却面临信息过载问题,难以从海量信息中挖掘对自己有用的信息。推荐系统可根据用户兴趣,从海量数据筛选出用户感兴趣的部分。目前,推荐系统已得到广泛应用,如Amazon,eBay,MovieLens,GroupLens等电子商务平台。
协同过滤技术是推荐系统中应用最广泛的技术之一,其基本思想是:利用用户的历史评分数据,来预测用户对未评分物品的兴趣度,选择兴趣度最高的几项物品作为推荐结果。对于传统的协同过滤算法,其最关键步骤是计算用户间或物品间的相似度,但随着数据的增长,用户评分数据会极度稀疏,而推荐质量也会随之下降。
目前,针对数据稀疏问题【1】,有以下几种解决方案:一是通过填充未评分物品来降低数据集的稀疏性【2-4】,该算法适用于物品更新不频繁且物品数远小于用户数的场景,依赖于用户行为同时存在冷启动问题;二是通过矩阵分解来降低数据集的稀疏性【5】,该算法利用用户与项目之间的潜在关系,对评分矩阵进行奇异值分解,该方法训练代价大,其不适应用户兴趣的改变;三是利用迁移学习思想,通过领域间的交叉部分来促进目标领域的学习【6-7】,该算法通过发现目标领域与辅助领域的潜在关系,达到辅助目标领域训练的目的,由此,其依赖于潜在关系的可靠程度,如不可靠会导致负迁移。目前,一些学者提出了利用多领域数据来缓解目标领域数据稀疏问题。如Jamali【8-9】等人提出了一种基于上下文的矩阵分解模HeteroMF,
其主要思想是利用多领域间共同实体,并共享实体的特征因子来同时对多个矩阵进行联合分解,其算法需要训练较多参数其需消耗大量时间计算梯度;LiBin【10】等人提出了一种评分矩阵生成模型RMGM(RatingMatrixGenerativeModel),其主要思想是通过找到共享的隐式集群级别的评级矩阵,然后利用这个矩阵填充目标领域中原始矩阵的空值,该方法使用与强相关领域且并没有理论支持;李超【10】等人提出的一种基于用户相似度迁移模TSUCF(TransferSimilarity
User-basedCollaborativeFiltering),其主要思想是交叉领域数据建立起辅助领域与目标领域的联系,达到辅助目标领域的目的,该方法仅利用用户评分信息,而且在衡量评分相似度时,仅采用共同物品数目来衡量,没有考虑用户的偏好。
虽然以上算法均采用辅助领域知识来提高推荐精度,但仍有一下不足:一是基于矩阵变换的模型,模型训练参数较多,二是要求辅助领域与目标领域满足强相关,模型适用场景少;三是计算用户评分相似度时,忽略了用户对满意度的打分标准的差异性。
数据稀疏性问题是传统协同过滤算法的主要瓶颈之一。迁移学习通常是利用目标领域与辅助领域的潜在关系,对辅助领域进行知识迁移,以此来提高目标领域的推荐质量。现有的基于相似度迁移模型,普遍只利用了用户评分信息,并且在评分相似度计算上忽略了用户评分标准差异。针对以上问题,本发明提出了一个基于综合相似度迁移的推荐方法。
参考文献:
[1]PanW。Asurveyoftransferlearningforcollaborativerecommendationwithauxiliarydata[J]。Neurocomputing,2016,177(C):447-453。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810050004.9/2.html,转载请声明来源钻瓜专利网。