[发明专利]一种个性化内容推荐方法、平台以及系统有效
申请号: | 201110263792.8 | 申请日: | 2011-09-07 |
公开(公告)号: | CN102982042A | 公开(公告)日: | 2013-03-20 |
发明(设计)人: | 陶振武 | 申请(专利权)人: | 中国移动通信集团公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京中誉威圣知识产权代理有限公司 11279 | 代理人: | 郭振兴;彭晓玲 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 个性化 内容 推荐 方法 平台 以及 系统 | ||
技术领域
本发明涉及无线互联网技术领域,具体来说,涉及一种个性化内容推荐的方法和系统。
背景技术
随着移动互联网时代的到来,用户的需求也发展到了一个新的阶段,体现为对贴心服务和个性化服务的追求。
同时,随着各种移动互联网业务的极大丰富,“用户寻找信息”的被动服务模式将逐步转变为“信息寻找用户”的主动服务模式。实现这种信息寻找用户的核心技术就是个性化推荐技术(Personalized Recommendation Techniques)。推荐技术就是通过记录和分析用户浏览行为或者购买行为,发现用户的兴趣偏好,然后在海量数据库中找到与之兴趣相近的人群、内容或者商品,筛选和过滤这些信息,然后向该用户推荐他可能会感兴趣的内容或者商品。例如您浏览过一本编程的图书,推荐技术就会关注很多其它同样找编程图书的用户,记录他们的搜索,浏览,点击和购买行为,来确定哪些人与当前用户具有同样的兴趣;然后,为当前用户做出个性化的商品或内容推荐。个性化推荐技术在互联网领域已经产生了巨大的商业价值,Amazon有35%以上的图书收入来自系统提供的推荐;Netflix有60%以上的电影租赁收入来自系统的推荐,Google利用个性化推荐技术为每个用户组织其新闻资讯,提升了38%的点击通过率;Apple的Genius的个性化音乐服务深受广大用户的喜爱。
在个性化推荐领域,网页这类文本内容的推荐又是一个非常重要的领域,尤其是在移动互联网领域,浏览网页(包括新闻资讯、博客等形式,客户端、浏览器等方式)仍然是当前移动互联网数据流量中的最主要的组成部分。手机能浏览到的网页中,WAP网页数量超过20亿,部分终端还能直接访问更丰富的Web网页。同时,移动互联网网网民超过3亿,其中绝大部分有过资讯内容的浏览行为。如何从海量的信息中计算得到海量用户可能感兴趣的内容并推荐给他,是一个极具挑战性的技术领域。
现有技术主要有两种技术方案比较流行,具体来说,包括:
(1)基于协同过滤的个性化推荐方法
协同过滤算法是以被推荐对象Item为中心的个性化推荐算法,Item可以是网页、图书、音乐、视频、实物等任意对象。根据机器学习理论,它属于基于实例的学习范畴。与传统的以用户为中心的实例学习算法相比,它的主要差异在于为每个Item、而不是用户构建近邻集合,并产生最终的评分预测结果。协同过滤算法有很多种,但原理上基本上一致。因此下面以其中最为典型的SlopeOne算法来进行说明:
SlopeOne算法提出的主要目的有两点:1)解决基于实例的算法可伸缩性问题。在典型的产品评论、电子商务类网站中,以Item为中心构建近邻集合相比于以用户为中心的算法能够显著减少计算量和存储开销;2)提升预测准确性。一些文献的经验评估表明,相比于以用户为中心的算法,此类算法预测准确性较高。需要指出的是,还有一类协同过滤算法,它们通过建立依赖关系来构建预测器,被称为“基于模型的算法”。在基于模型的算法中,一般不显著构建近邻集合,而是通过训练贝叶斯网络、模糊聚类等方式来产生预测结果。它们的离线计算复杂度通常远高于基于实例的算法,但存储开销和在线计算复杂度又远低于后者。在实践中,这两类算法都有大规模应用的案例。其主要流程如图1所示。
(2)基于内容的个性化推荐算法
基于内容的推荐(content-based recommendation)不需要依据用户对项目的评价意见,而依据用户已经选择的产品内容信息计算用户之间的相似性,送两送行相应的推荐。随着机器学习等技术的完善,当前的基于内容的推荐系统可以分别对用户和内容建立配置文件,通过分析已经购买(或浏览)过的内容,建立或更新用户的配置文件。系统可以比较出用户与内容的相似度,并直接向用户推荐与其配置文件最相似的产品。基于内容的推荐算法的根本在于信息获取和信息过滤。因为在文本信息获取与过滤方法的研究较为成熟,现有很多基于内容的推荐系统都是通过分析产品的文本信息进行推荐。
在信息获取中,表征文本最常用的方法就TF-IDF方法,该方法的定义如下:设有M个文本文件,关键词ki在mi个文件中出现,设fij为关键词ki在文件di中出现的次数,那么ki在文件dj中的词频TFij定义为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团公司,未经中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110263792.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种道路限速控制装置
- 下一篇:一种能够调节切割半径的路面切割机
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法