[发明专利]一种基于多维标签与分类排序的推荐算法有效
申请号: | 201710402897.4 | 申请日: | 2017-06-01 |
公开(公告)号: | CN107341687B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 董敏;刘皓熙;毕盛;汤雪;裴茂锋 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q30/06;G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多维 标签 分类 排序 推荐 算法 | ||
本发明公开了一种基于多维标签与分类排序的推荐算法,包括步骤:1)对标签数据进行组合构成多维标签信息;2)利用多维标签信息计算多维标签相似度,融入用户协同过滤中并预测评分,得到推荐候选集1;3)利用多维标签信息作为隐式反馈信息输入到矩阵分解中并预测评分,得到推荐候选集2,并结合推荐候选集1得到最终推荐候选集;4)将得到的最终推荐候选集输入到逻辑回归分类模型中分类排序,根据输出分值排序得到Top‑N推荐列表。本发明将标签信息组合成多维标签,融入到协同过滤中得到推荐候选集,再通过逻辑回归分类排序得到Top‑N推荐列表,有效缓解推荐系统的冷启动问题,稀疏性问题和可拓展性问题,提高推荐效果。
技术领域
本发明涉及数据挖掘的推荐系统技术领域,尤其是指一种基于多维标签与分类排序的推荐算法。
背景技术
协同过滤的推荐算法是目前使用最广泛且发展成熟的个性化推荐算法。基于近邻协同过滤是利用相似近邻进行推荐,冷启动和稀疏性问题可能导致计算得到的用户相似度不准确,进而影响协同过滤的推荐性能。对基于用户的协同过滤来说,核心是计算用户相似度,计算两个用户之间相似度需要这两个用户评价过相同的项目,然而在推荐系统中对于大量的物品,用户操作过的物品只占很小一部分,也就是推荐系统存在稀疏性。本来两个相似的用户,可能因为他们评价的项目较少而导致了他们之间没有共同评价过的项目,稀疏性会导致这两个相似的用户在相似度计算的时候相似度为0,引起比较大的误差。
Top-N推荐更加符合推荐系统的本质,不少研究将Top-N推荐问题看作是排序问题,使用排序学习解决。常见的方法有基于点的排序,基于对的排序,基于列表的排序。但是不是所有的排序学习算法都适合用于协同过滤。基于对的排序学习将排序问题转化为多个二分类问题,对任意两个文档进行比较,时间复杂度较高。基于对的排序学习贴近排序学习的本质,但是该方法计算复杂度高,只能应用在比较小规模的问题中,面对协同过滤这种大规模数据集应用问题,仍然没有一个比较好的解决方案。
本发明提供的一种基于多维标签与分类排序的推荐算法,将标签信息转化构成多维标签信息,然后融入协同过滤中,从而缓解协同过滤的稀疏性和冷启动问题,得出推荐候选集,最后使用逻辑回归分类模型进行分类排序进行Top-N推荐,缓解可拓展性的同时提高推荐效果。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供了一种基于多维标签与分类排序的推荐算法,缓解传统协同过滤常见的冷启动和稀疏性问题,同时利用逻辑回归分类模型进行分类排序,获得更好的推荐效果,也缓解了Top-N推荐的可拓展性问题。
为实现上述目的,本发明所提供的技术方案为:一种基于多维标签与分类排序的推荐算法,包括以下步骤:
1)对标签数据进行组合构成多维标签信息;
2)利用多维标签信息计算多维标签相似度,融入用户协同过滤中并预测评分,得到推荐候选集1;
3)利用多维标签信息作为隐式反馈信息输入到矩阵分解中并预测评分,得到推荐候选集2,并结合推荐候选集1得到最终推荐候选集;
4)将得到的最终推荐候选集输入到逻辑回归分类模型中分类排序,根据输出分值排序得到Top-N推荐列表。
在步骤1)中,所述多维标签信息是指通过用户标签和物品标签组合,并根据不同物品标签之间的联系进行组合,包含以下步骤:
1.1)一个用户标签对应多个取值,将用户标签离散化,设用户标签集合为M={m1,m2,m3...mz},z为用户标签的取值个数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710402897.4/2.html,转载请声明来源钻瓜专利网。