[发明专利]一种结合标签和时间因素的协同过滤推荐方法在审
申请号: | 201810001758.5 | 申请日: | 2018-01-02 |
公开(公告)号: | CN108334558A | 公开(公告)日: | 2018-07-27 |
发明(设计)人: | 杨明;张春霞 | 申请(专利权)人: | 南京师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/06;G06Q30/02;G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 葛潇敏 |
地址: | 210023 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 时间因素 协同过滤 标签 个性化推荐 邻居用户 数据稀疏 有效缓解 物品集 相似度 预测 算法 | ||
本发明公开一种结合标签和时间因素的协同过滤推荐方法,包括如下步骤:步骤1,基于评分或标签计算用户间、物品间的相似度;步骤2,寻找邻居用户集、物品集;步骤3,预测评分,提供个性化推荐。此种方法可有效缓解数据稀疏性问题,提高推荐算法的预测准确性。
技术领域
本发明属于推荐学习领域,特别涉及一种结合标签和时间因素的协同过滤推荐方法。
背景技术
目前,已有的推荐技术包括基于内容的推荐、协同过滤推荐、混合推荐等,基于内容的推荐算法,首先由系统隐式地获取或者由用户显式地给出用户对物品属性的偏好,然后通过计算已知用户偏好和待预测物品的描述文档(由物品属性刻画)之间的相似度,最后按照偏好排序结果向用户推荐其可能感兴趣的物品。协同过滤,利用当前用户或者其他用户对部分物品的已知偏好数据来预测当前用户对其他物品的潜在偏好,或者利用部分用户对当前物品或者其他物品的已知偏好数据来预测其他用户对当前物品的潜在偏好。协同过滤算法可以分为基于邻域的协同过滤算法和基于模型的协同过滤算法。基于邻域的协同过滤推荐算法包括基于用户的协同过滤推荐算法和基于物品的协同过滤算法。
在使用基于内存协同过滤算法进行评分预测时,用户或物品间的相似度度量扮演者重要角色。传统的协同过滤算法从用户-物品评分矩阵中计算相似度,但是评分矩阵是非常稀疏的,这就导致了推荐的不准确。同时,推荐系统中存在着大量的描述用户和物品的属性特征的标签信息,以及反映用户行为的时间信息,针对电影推荐来说,电影的标签信息就是描述其类型的关键字,用户的标签信息是<性别,年龄,职业>等人口统计学信息。把这些信息融入到传统推荐算法中,是缓解数据稀疏性和冷启动问题的有效方法。
发明内容
本发明的目的,在于提供一种结合标签和时间因素的协同过滤推荐方法,此种方法可有效缓解数据稀疏性问题,提高推荐算法的预测准确性。
为了达成上述目的,本发明的解决方案是:
一种结合标签和时间因素的协同过滤推荐方法,包括如下步骤:
步骤1,基于评分或标签计算用户间、物品间的相似度;
步骤2,寻找邻居用户集、物品集;
步骤3,预测评分,提供个性化推荐。
上述步骤1中,在计算相似度前,首先对标签信息进行预处理,将文本信息转化成数字信息。
上述步骤1中,基于标签计算相似度的公式是:
其中,用户u1或物品i1的标签集所对应的数值型标签向量为t=(t1,t2,…,tm),用户u2或物品i2的标签集所对应的数值型标签向量为s=(s1,s2,…,sm)。
上述步骤1中,基于评分计算用户间相似度的公式是:
其中,Ruj、Rvj分别表示用户u对物品j的评分和用户v对物品j的评分,分别表示用户u对所有物品的平均评分和用户v对所有物品的平均评分,Iuv表示用户u和用户v共同评论的物品集,wi为热门物品惩罚项。
上述热门物品惩罚项wi的计算公式是:
其中,Ni表示评论过物品i的用户数。
上述步骤1中,基于评分计算物品间相似度的公式是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京师范大学,未经南京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810001758.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种分析互联网金融海量日志的方法及系统
- 下一篇:一种图数据的处理方法及装置