[发明专利]一种结合模糊权重相似性度量和聚类协同过滤的方法有效
申请号: | 201410457937.1 | 申请日: | 2014-09-10 |
公开(公告)号: | CN104239496B | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 齐小刚;张雅科;郑耿忠;刘立芳;马军艳;李强;杨国平;冯海林 | 申请(专利权)人: | 西安电子科技大学;韩山师范学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙)11350 | 代理人: | 汤东凤 |
地址: | 710071 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 模糊 权重 相似性 度量 协同 过滤 方法 | ||
技术领域
本发明属于推荐系统技术领域,尤其涉及一种结合模糊权重相似性度量和聚类协同过滤的方法。
背景技术
随着互联网和信息技术的快速发展和普及,人们对信息的依赖程度与日俱增。信息技术的大量使用提高了信息的生产、处理和传播的效率。互联网作为信息时代的基础平台,承载了大量的信息资源。面对海量的信息资源,用户无法筛选出对自己有用的信息,这就是信息过载问题。为了解决信息过载问题,推荐系统应运而生。与传统的信息过滤技术搜索引擎相比,推荐系统不需要用户提供搜索的关键词,而是通过分析用户历史行为记录发现用户潜在爱好,从而产生推荐。因此,推荐系统满足了用户的个性化需求。
协同过滤推荐算法是推荐系统的主流算法,这种算法的基本思想是:用户会喜欢(不喜欢)与他兴趣相同(不相同)的用户所喜欢的项目。协同过滤算法主要分为:基于内存的算法和基于模型的算法。基于内存的协同过滤算法可分为基于用户的协同过滤算法(user-based collaborative filtering,UBCF)和基于项目的协同过滤算法(item-based collaborative filtering,IBCF)。两种算法的关键都在于相似度的计算,不同的相似度计算方法会对目标用户产生不同的邻居集,进而影响推荐结果。而传统的相似度计算方法直接应用用户的评分值或评分偏差,没有考虑用户评分的不确定性和不同的评分习惯。因此,我们应该给原始评分加上合适的权重值,以逼近用户真实的评分意愿。文献Improving Coll-aborative Filtering Recommender System Results and Performance Using Genetic Algorithms研究了评分和权重线性组合以优化相似度计算函数方法,其中权重通过遗传算法(genetic algorithm)迭代收敛到预定条件。文献Optimizing Collaborative Filtering Recommender Systems提出了对用户和邻近项目采用不同的权重方式来提高推荐的质量。文献Cluster ensembles in collaborative filtering recommendation提出了聚类融合技术,首先应用两个著名的聚类技术(self-organizing maps(SOM)和k-means)对用户进行聚类寻找相似用户群,然后分别用三种聚类融合算法(the cluster-based similarity partitioning algorithm(CSPA),hypergraph partitioning algorithm(HGPA)和majority voting)对相似用户群进行融合得到综合相似关系群。最后,利用综合相似关系群为目标用户推荐项目。该方法改善了基于用户的协同过滤推荐算法面临的“冷启动”问题,而且提高了推荐系统的推荐精度。文献A fuzzy recommender system based on the integration of subjective preferences and objective information将模糊语义模型融入到协同过滤推荐中,并提出了组合主观和客观用户观点的协同过滤算法(aggregated subjective and objective users’ viewpoint(ASOV))该算法在一定程度上解决了“冷启动”和数据稀疏性问题。文献Facing the cold start problem in recommender systems提出了改进的相似度技术、预测机制,将人口统计信息应用到相似关系群的查找,该方法改善了协同过滤推荐算法面临的“冷启动”问题。
虽然国内外的众多学者对协同过滤推荐算法进行了深入地研究,但协同过滤算法仍存在很多值得研究的问题,特别是大量数据导致的稀疏性问题,“冷启动”问题和提高推荐精度等方面仍值得进行探索。
发明内容
本发明实施例的目的在于提供一种结合模糊权重相似性度量和聚类协同过滤的方法,旨在解决协同过滤算法中存在的提高推荐精度,数据稀疏性问题和“冷启动”问题。
本发明实施例是这样实现的,一种结合模糊权重相似性度量和聚类协同过滤的方法,该结合模糊权重相似性度量和聚类协同过滤的方法根据用户评分值和模糊权重wc,计算任意两个用户之间的相似度;利用k-means聚类方法对全部用户分成若干类;对于目标用户,在所属的类中按相似度由高到底选取邻居集;然后,根据邻居集内其他用户对目标项目的评分,预测目标用户对目标项目的评分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学;韩山师范学院,未经西安电子科技大学;韩山师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410457937.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:洗碗机
- 下一篇:一种可折叠三角平板拖