[发明专利]一种基于高斯混合的大数据智能推荐方法有效
申请号: | 201710844205.1 | 申请日: | 2017-09-19 |
公开(公告)号: | CN107545471B | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 杨永丽;宁振虎;薛菲;公备;王昱波 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q30/06;G06K9/62;G06N3/00 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混合 数据 智能 推荐 方法 | ||
本发明公开了一种基于高斯混合的智能推荐方法,属于大数据智能推荐领域;本发明基于高斯混合模型的协同过滤推荐算法GMM‑TCF的研究及应用,主要包括用户和项目联合概率的生成、如何定义大数据推荐模型中的最大似然函数、如何对大数据推荐模型中的高斯混合参数进行初始化和优化、以及怎么样将基于高斯混合的用户兴趣度模型与基于项目的推荐模型进行线性结合。一方面从最初用户属于某一个聚类到多个聚类的转变,这使得用户的兴趣得到了极大的体现;另一方面,通过添加项目时间因子,提高了项目之间的相似度,从而建立基于项目的预测模型,使得算法的推荐效果更好,推荐精度更高。
技术领域
本发明涉及一种基于高斯混合的智能推荐方法,属于大数据智能推荐领域,涉及大数据推荐模型与群智能优化算法的结合及使用。
背景技术
随着电子商务的发展,商家提供的商品种类和数量急剧增长。具有明确需求的用户可直接通过搜索查找想购买的商品即可。然而,实际中用户需求通常具有不确定性和模糊性。据亚马逊统计,在其网站购物的客户中,有明确购买意向的仅占16%。如果商家能够从海量的商品中把满足用户模糊需求的商品主动推荐给用户,则有望将潜在需求转化为实际需求,不仅能提高电子商务网站的销售量,还有助于提高用户对网站的忠诚度。在此背景下,能够根据用户特征有针对性推荐商品的个性化推荐系统应运而生,并被广泛应用。包括Amazon、eBay、YouTube和Google在内的诸多网站都部署了不同形式的推荐系统,并产生了巨大的商业利润。据统计,2006年推荐系统为Amazon提高了30%的销售额。推荐系统具有重要的应用价值,不仅成为计算机领域具有挑战性的研究课题之一,还吸引了来自数学、物理、认知、人工智能、管理、市场营销等众多领域的研究者。
因此如何有效地利用数据挖掘和机器学习方法向用户推荐有价值的个性化信息成为有很强实际意义的问题。协同过滤是一种能够产生个性化推荐的有效技术,在各种推荐系统中都得到广泛应用,其基本任务是根据相似的偏好匹配用户,以推荐用户可能会喜欢的项目。协同过滤算法一般可以分为基于内存和基于模型。其中,基于内存的协同过滤又可分为基于用户和基于项目。前者是计算用户间相似度,得到与目标用户兴趣偏好相似的最近邻,以此为基础进行预测推荐。它没有对原有数据进行学习的能力,不具有很好的扩展性,且存在冷启动问题。而基于项目的推荐是从商品角度计算项目之间的相似度,通过项目的最近邻搜索来产生推荐。一般来讲,项目间相似度比用户偏好的相似度稳定,离线对前者进行计算,避免了线上大数量级用户的最近邻搜索,大大降低了在线计算量。与基于内存的算法不同,基于模型的算法不是直接通过用户-项目原始评分数据进行计算推荐,而是用机器学习的方法对数据进行学习建模,再通过模型预测用户对未评分项目的习惯偏好。常用的模型包括贝叶斯、奇异值分解(Singular ValueDecomposition,SVD)、潜在语义分析(Latent Semantic Analysis,LSA)、概率潜在语义分析(Probabilistic Latent SemanticAnalysis,PLSA)等。
然而,基于模型的算法有必要考虑如下问题:第一,用户对项目评分的高低受多种因素影响,包括用户对项目主题/内容的感兴趣程度,用户的评分习惯,项目本身的品质等。第二,单一的潜变量很难同时体现用户与用户,项目与项目,用户与项目之间的关系,需要将用户按照相似的兴趣和偏好聚类,将项目按照相似的主题和内容聚类。第三,通常的“硬”聚类方式,即每个用户或项目只属于单一的一个类,很难描述同一用户可能具有的多种兴趣以及同一项目的多种不同属性。比较合理的做法是“软”聚类,每个用户或项目依概率属于多个类,用户在某类上概率值的大小反映了用户对这一类的偏好程度,项目亦然。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710844205.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置