[发明专利]一种内容推荐方法及内容推荐系统有效
申请号: | 201611177415.1 | 申请日: | 2016-12-19 |
公开(公告)号: | CN106599226B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 王娜;王文君;高睿;汪景福;陈昭南 | 申请(专利权)人: | 深圳大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536 |
代理公司: | 深圳市恒申知识产权事务所(普通合伙) 44312 | 代理人: | 王利彬 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 内容 推荐 方法 系统 | ||
本发明涉及数据分析与处理技术领域,尤其涉及一种用于向目标用户推荐感兴趣内容的内容推荐方法及内容推荐系统。本发明基于自然语言处理中的连续词袋模型对各用户的历史查看内容序列进行学习训练得到连续词袋模型,从而得到每个内容的内容向量,再根据每个内容的内容向量获取目标用户查看过的内容的相似内容,然后计算目标用户对各相似内容的兴趣度,最后提取出目标用户兴趣度最高的预设数量个内容推荐给目标用户。本发明不利用内容和用户的描述信息、属性或标签,不会因内容和用户的信息的缺失导致算法的鲁棒性变差。同时,本发明计算速度远超协同过滤和基于内容的推荐算法。再者,本发明将内容表示成等长的向量,可迎合各种现成的相似度算法。
技术领域
本发明涉及数据分析与处理技术领域,尤其涉及一种用于向目标用户推荐感兴趣内容的内容推荐方法及内容推荐系统。
背景技术
随着人们逐渐步入信息时代,当今世界正处于信息大爆炸的环境下,并且面临着严峻的信息过剩问题。仅在2011年,全球数据量就达到了1.8ZB,相当于全世界每个人产生200GB以上的数据。这种增长趋势仍在加速,据保守预计,接下来几年中,数据将始终保持每年50%的增长速度。如今,各大电商、视频播放等平台用户每天都将产生海量的数据,因此如何有效地利用用户产生的数据是当今互联网企业亟需解决的问题。这时候个性化的推荐系统作为数据挖掘的手段便应运而生了。推荐系统指的是互联网站向用户提供产品信息或建议,让用户发现自己潜在的兴趣和需求并帮助用户选择产品。
传统的相关视频推荐算法有基于视频的协同过滤和基于内容的相关推荐。基于视频的协同过滤使用用户对视频的偏好,发现视频间的相似度,然后根据用户的历史偏好信息将相似视频推荐给用户。基于视频的协同过滤根据用户-视频评分矩阵计算视频间的相似度,从而确定目标视频的邻居视频,再向目标用户推荐与其历史观看的视频相似度高的视频,其中查找用户观看历史视频的邻居视频是协同过滤算法的关键步骤。其优点在于,不依赖用户的属性信息和视频的内容信息,仅仅通过分析大量用户对视频的行为数据,从中找到特定的行为模式,据此来预测用户的兴趣并作出相关推荐。它不需要对视频或者用户进行严格的建模就可以作出令人满意的推荐结果。基于内容的推荐算法是根据视频的描述信息发现视频之间的相关性,这是推荐系统出现之初应用最为广泛的推荐机制,其核心思想在于利用视频的描述信息发现视频之间的相关性,然后基于用户以往的喜好记录推荐给用户相似的视频。其优点在于易于实现,不需要用户数据因此不存在稀疏性和冷启动问题,而且基于视频本身的特征也不会出现过度推荐热门的问题。
基于视频的协同过滤的缺点有:①推荐效果依赖于用户历史偏好数据的多少和准确性;②用户历史和偏好是用稀疏矩阵进行存储的,而且稀疏矩阵上的计算有明显的问题,少部分人的错误偏好对准确度有较大的影响;③由于用户和视频的数量非常大,因此用户-视频矩阵的计算量会非常大,在实时推荐实现时难度也会较大。基于内容的相关推荐的缺点有:①视频的描述信息会有缺失,导致无法提取视频属性;②抽取的视频特征纪要保证准确性又要具有一定的实际意义,否则很难保证推荐结果的相关性。
上述缺陷同样也出现在其他诸如音乐、新闻、商品的推荐过程中。
发明内容
本发明所要解决的技术问题是,提供一种内容推荐方法及内容推荐系统,不使用内容的描述信息或属性,也不使用用户的描述信息或属性,即可实现内容的准确推荐。本发明是这样实现的:
一种内容推荐方法,包括如下步骤:
步骤A:获取所有用户的内容查看历史数据,每个用户的内容查看历史数据包括该用户查看过的所有内容以及各内容的查看时间;
步骤B:按照查看时间先后顺序分别对每个用户查看过的所有内容进行排序,得到每个用户的历史查看内容序列;
步骤C:对每个用户的历史查看内容序列进行连续词袋模型训练,得到连续词袋模型,从而得到每个内容的内容向量;
步骤D:获取目标用户在预设时间窗口内查看过的内容的集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611177415.1/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法