[发明专利]一种基于深度学习的推荐方法有效
申请号: | 201810536538.2 | 申请日: | 2018-05-30 |
公开(公告)号: | CN108763493B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 石鑫;屈鸿;符明晟;史冬霞 | 申请(专利权)人: | 深圳市思迪信息技术股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/08 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 徐金琼 |
地址: | 518057 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 推荐 方法 | ||
本发明公开了一种基于深度学习的推荐方法,属于数据挖掘技术领域,解决现有的推荐方法,不能从包含了项目的描述和元数据的文本内容信息中来预测该项目的潜在因子向量,造成推荐不准确的问题;本发明对用户的历史行为数据的隐式反馈特性进行建模,建模后学习得到用户和项目的隐因子向量;将项目的隐因子向量作为标签训练对项目文本内容的时序信息进行建模和深层次地挖掘的网络模型;对于未出现在用户历史行为数据中的新项目,将项目的文本内容信息中通过步骤(2)得到的网络模型预测得到项目的隐因子向量,然后将其与步骤(1)得到的用户隐因子向量直接匹配,并将匹配度进行排序,得到每个用户的新项目推荐列表。本发明用于新项目的推荐。
技术领域
一种基于深度学习的推荐方法,用于新项目的推荐,属于数据挖掘、自然语言处理、个性化推荐等技术领域。
背景技术
基于内容的推荐,通常从项目的描述和元数据等内容信息中预测用户偏好。最基础的推荐算法是根据项目的可用的元数据进行推荐,例如在电影推荐中,电影的元数据可能包括电影的类别属性、参与的演员、制作的导演和电影的大众评分等等。然而,这将导致可以预知的推荐。例如推荐用户已经熟知的演员的电影,通常这将不是有效的推荐。另一种推荐算法是根据项目的描述信息进行推荐,例如在电影推荐中,使用电影的标题和内容简介等描述信息,这些描述信息通常使用词袋模型进行表征,通过测量描述信息的表征向量之间的相似性,可以尝试为用户推荐与该用户以前看过的电影相似的电影。这种方法需要定义一个合适的相似性度量。这样的度量通常是基于描述信息的先验知识来自定义,因此它们不一定是基于内容的推荐方法的最佳选择。因此,一些研究人员已经使用用户偏好数据来调整相似性度量。
基于协同过滤的推荐方法可以是基于邻域或基于模型的。前一种方法依赖于用户或项目之间的相似性度量,他们推荐具有类似偏好的其他用户所消费的项目,或与用户已经消费的项目类似的项目。另一方面,基于模型的方法试图建模用户和项目的潜在特征,这些特征通常表示为潜在因素的向量。潜在因素模型的有效性在Netflix奖项中的电影推荐中得以证明,由此,潜在因素模型在推荐领域的应用也越来越广泛。潜在因子向量形成了用户口味在不同方面的简洁描述,同时也形成了相应的项目特征。由于很多项目的使用数据很少甚至缺失,对于使用数据很少的项目通常不能可靠地估计这些项目的潜在因子向量,而对于使用数据缺失的项目则无法获取该项目的潜在因子向量。因此,能够从包含项目的描述和元数据的文本内容信息来预测这些项目的潜在因子向量的混合推荐方法将是有效可行的推荐方法。这就是本文研究的推荐方法。
影响用户偏好的项目的潜在因子与项目的文本内容信息之间存在着巨大的语义差距。例如,从电影的文本内容信息中提取诸如艺术风格、商业性、科技性和寓意主题等高级属性需要强大的模型,能够捕捉复杂的文本语法和语义特征。此外,单单从电影的文本内容信息中不可能获得某些属性,如导演或者演员的知名度、名誉和位置。基于内容的推荐方法目前现有的推荐算法不能从同时包含项目的描述信息和项目的元数据的文本内容信息中精确地预测项目的潜在因子。即使表征文本内容信息的词袋模型可以在学习项目的整体表示和单词表示时提供有价值的信息,但是,这种表示方式忽略每个单词周围的单词和所处位置语境的顺序信息,在挖掘内容信息时存在着很大的瓶颈。因此,如何有效地从项目的文本内容信息中挖掘出影响用户对项目偏好的高级属性,一直是推荐系统领域的研究难点和重点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市思迪信息技术股份有限公司,未经深圳市思迪信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810536538.2/2.html,转载请声明来源钻瓜专利网。