[发明专利]一种基于词向量的个性化媒体内容推荐系统及方法在审
申请号: | 201710242747.1 | 申请日: | 2017-04-14 |
公开(公告)号: | CN108733669A | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 陶冠语;张伟楠;赵旺;吴旭阳 | 申请(专利权)人: | 优路(北京)信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京知舟专利事务所(普通合伙) 11550 | 代理人: | 郭韫 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 输入端连接 词向量 输出端 向量生成模块 聚类模块 学习模块 个性化媒体内容 向量数据库 推荐系统 文章推荐 中文分词 输入端 信息技术领域 互联网媒体 存储模块 服务媒体 海量文本 用户历史 文本库 浏览 | ||
本发明提供了一种基于词向量的个性化媒体内容推荐系统及方法,属于互联网媒体信息技术领域。该系统包括:中文分词模块、词向量学习模块、词聚类模块、文章向量生成模块、文章推荐模块和用户历史文章浏览存储模块;所述中文分词模块的输入端与词典和海量文本库连接,其输出端与词向量学习模块的输入端连接;所述词向量学习模块的输出端与词聚类模块的输入端连接,所述词聚类模块的输出端与所述文章向量生成模块的一个输入端连接;所述文章向量生成模块的另一个输入端与服务媒体文本库连接,所述文章向量生成模块的输出端与文章向量数据库的输入端连接,所述文章向量数据库的输出端与文章推荐模块的第一个输入端连接。
技术领域
本发明属于互联网媒体信息技术领域,具体涉及一种基于词向量的个性化媒体内容推荐系统及方法。
背景技术
个性化推荐系统工作于广大互联网服务上,包括互联网媒体、音乐服务、电影服务、电商以及在线教育等等。根据每个用户在站点上的行为数据以及自身属性数据,站点的推荐引擎向他推荐与其兴趣爱好匹配的物品(item,即内容或商品),增加用户的点击率和黏性,改善用户体验,提高站点的流量。
个性化推荐系统的算法大致分为两大类:基于内容的推荐(content-basedrecommendation)和协同过滤的推荐(collaborative filtering recommendation)。其他相关技术大类也有基于知识库的推荐(knowledge-based recommendation),但比起前两类,应用较少。
基于内容的推荐系统其原理主要是匹配用户的属性数据(例如年龄、性别、职业、地点和兴趣标签等等)和物品内容或属性数据(例如文本、类别、生产商等等)。该类技术简单直接,易于工程上的实现,但其并不(直接)关心用户的历史行为,以致于推荐效果并不特别理想。
基于协同过滤的推荐则重点分析用户行为以及不同用户之前行为的协同性,对此做出推荐决策。协同过滤的推荐算法则又在建模层面上分为两种:基于记忆的协同过滤(memory-based collaborative filtering)和基于模型的协同过滤(model-basedcollaborative filtering)。基于记忆的协同过滤算法的原理是基于相似物品的推荐(item-based recommendation)和基于相似用户的喜好的推荐(user-basedrecommendation)。该类算法简洁直观、方便实现和调试,并且直接利用了用户的历史行为数据。基于模型的协同过滤则是基于用户的历史行为数据通过机器学习的方法训练出一个模型,在基于此模型对给定的用户做出推荐决策。隐因子模型(latent factor),包括概率隐因子模型(probabilistic latent semantic analysis)和矩阵分解模型(matrixfactorization)。
文本分析是数据挖掘的一个典型的问题,包括很多经典任务,例如文本分类、文本聚类、主题模型、情感分析等等。其中,情感分析属于文本分类的一种特殊问题,即判断一段文字是正面态度还是负面态度。经典的分类模型大都可以运用到文本分类当中,例如支持向量机(support vector machine),朴素贝叶斯(Bayes)等等。
而主题模型则是一种文本聚类的特殊设置,这时一个文本可以同时拥有多个主题(聚类)。而传统的数据聚类算法则可以运用到文本聚类问题上,例如经典的k-means算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于优路(北京)信息科技有限公司,未经优路(北京)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710242747.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于查询数据的方法和装置
- 下一篇:一种地图数据检查的方法及装置