[发明专利]一种混合高斯建模改进的协同过滤推荐方法有效
申请号: | 201711267674.8 | 申请日: | 2017-12-05 |
公开(公告)号: | CN108108399B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 邓辉舫;周君君 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 混合 建模 改进 协同 过滤 推荐 方法 | ||
本发明公开了一种混合高斯建模改进的协同过滤推荐方法,包括步骤:1)对用户‑物品评分矩阵的各个物品的评分分布建立混合高斯模型;2)利用EM算法计算出每个物品评分分布的混合高斯模型参数;3)根据每个物品评分的混合高斯模型计算每个用户的惊异度向量;4)根据用户的惊异度向量计算用户之间的相似度;5)根据用户之间的相似度进行协同过滤推荐。本发明通过对物品评分分布进行混合高斯建模,计算出所有用户的惊异度向量,在此基础上计算用户的相似度,最后进行协同过滤推荐,缓解数据的稀疏性问题,有效的提高推荐效果。
技术领域
本发明涉及数据挖掘的协同过滤推荐的技术领域,尤其是指一种混合高斯建模改进的协同过滤推荐方法。
背景技术
随着信息技术和互联网的发展,人们逐渐从信息匮乏时代走入了信息过载的时代,信息生产者希望自己生产的内容能够在海量的信息中脱颖而出,信息消费者希望从浩瀚的信息海洋中寻找到自己感兴趣的内容。当用户的信息需求十分明确时,分类目录和搜索引擎提供了一种迅速寻找到用户所需要信息的方式,但是分类目录往往只能够覆盖少量的类别信息且相比于用户具体的需求来说较为抽象,而搜索引擎虽然能够针对用户的搜索关键字返回相关的结果,但是要求用户能够用关键词来准确的描述自己所希望寻找的信息,否则搜索引擎所返回的信息也不是用户所希望获取的。推荐系统在信息过载以及用户需求不明确的情况下,通过分析用户的历史行为对用户的兴趣建模,从而主动给用户推荐能够满足他们兴趣的信息,从信息的角度来说,推荐系统能够更好的发掘信息的长尾,从而帮助非热门的信息提供给感兴趣的用户。
协同过滤推荐算法是目前使用最广泛且发展成熟的个性化推荐算法。对协同过滤算法来说,核心在于计算用户之间的相似度。一般的用户相似度是找到两个用户评过分的公共物品,计算这些物品对应评分向量的余弦相似度。这种用户相似度的计算方法没有挖掘出用户之间更深入的相似信息,不能够取得比较好的推荐效果。根据信息检索领域的经典模型TF-IDF(词频-倒排文档频率)的思想,对于一个物品的评分越是远离主流的评分范围,说明该评分越能够提供更多关于该用户的信息,反之,越是在主流评分范围内说明该评分越是不具有好的区分能力和代表性,因此对评分进行建模并对用户评分所包含的信息量进行刻画是一种改善用户相似度度量效果的途径。
本发明提供的一种混合高斯建模改进的协同过滤推荐方法,对物品的评分分布进行混合高斯建模,得到用户的惊异度向量,在此基础上计算用户的相似度,然后进行协同过滤推荐。它发掘出评分中更具代表性和区分性的信息,缓解了协同过滤的稀疏性问题,提高了推荐效果。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种混合高斯建模改进的协同过滤推荐方法,改善用户之间的相似度度量准确性,缓解了传统协同过滤的数据稀疏性问题,通过混合高斯模型挖掘出用户评分中具有代表性和区分性的信息,获得更好的推荐效果。
为实现上述目的,本发明所提供的技术方案为:一种混合高斯建模改进的协同过滤推荐方法,包括以下步骤:
1)对用户-物品评分矩阵的各个物品的评分分布建立混合高斯模型;
2)利用EM算法即期望最大化算法估算每个物品评分分布的混合高斯模型参数;
3)根据每个物品评分的混合高斯模型计算每个用户的惊异度向量;
4)根据用户的惊异度向量计算用户之间的相似度;
5)根据用户之间的相似度进行协同过滤推荐。
在步骤1)中,所述用户-物品评分矩阵是指M个用户对N个物品进行评分后得到的矩阵TM×N,如下式所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711267674.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种浏览量显示方法和装置
- 下一篇:一种API基于本地数据增量的方法