[发明专利]一种基于深度学习的商品推荐方法及系统在审

专利信息
申请号: 201710271969.6 申请日: 2017-04-24
公开(公告)号: CN107038609A 公开(公告)日: 2017-08-11
发明(设计)人: 刘道洋 申请(专利权)人: 广州华企联信息科技有限公司
主分类号: G06Q30/02 分类号: G06Q30/02;G06F17/30
代理公司: 广州骏思知识产权代理有限公司44425 代理人: 吴静芝
地址: 510220 广东省广州市海珠区新港*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 商品 推荐 方法 系统
【说明书】:

技术领域

发明涉及一种推荐方法,特别是一种基于深度学习的商品推荐方法及系统。

背景技术

伴随着互联网的发展,电子商务作为新兴产业应运而生,电子商务把商品从实体店搬运到网络的虚拟环境中,使得用户足不出户就可以购物。虚拟购物的优势在于降低了卖家的成本,提高了买家的购物体验。但对于网络购物的用户来说,网络上纷繁多样的商品给挑选带来了麻烦。解决这一问题的方法就是使用推荐系统为用户做出个性化的物品推荐,也就是说可以通过分析用户以往购物的浏览、点击、购买,评论等行为以及用户自身的属性得出用户的潜在兴趣,从而将用户感兴趣的商品推荐给用户。个性化推荐的意义在于可以提高用户挑选商品的效率,对于电子商务网站而言,精准的个性化推荐可以提高用户行为的转化率,从而提高网站的收益。Amazon是电子商务领域运用推荐系统的代表,Amazon的前科学家Greg Linden在他的博客中提到,2006年,推荐系统对Amazon的贡献额在35%左右。目前推荐系统在互联网上已经得到了广泛的应用,Netflix曾开出100万美元的奖金,奖励给能将其电影推荐精度提高10%的个人或者团队,除此以外,推荐系统应用的例子还有Google的新闻推荐、Delicious的网页推荐、Facebook的朋友推荐等。

推荐系统可以分成三类:基于内容推荐、协同过滤推荐和基于内容和协同过滤的混合推荐。基于内容推荐是基于用户和物品的内容信息做出推荐,不需要用户对物品的评价,即用户行为,因此该方法没有冷启动和数据稀疏性问题。基于内容推荐的主要缺点是要求抽取的特征既要保证准确性又要有实际意义,通常情况下这是很难做到的。协同过滤推荐的基本原理是给目标用户推荐和其相似的用户喜好的物品或者给目标用户推荐和其以往有过行为的物品相似的物品。协同过滤的优点是能够共享他人的经验,从而能够避免基于内容推荐存在的内容分析不完全和不精确的问题,并且能够基于一些复杂的、难以表述的概念(如个人品味)进行过滤。但由于协同过滤方法依赖用户行为数据,因此存在冷启动和数据稀疏性问题。基于内容和协同过滤的混合推荐结合了上述两类推荐方法的优点,将内容和用户行为互相作为信息补充,从而降低了抽取所得特征的准确性对基于内容推荐的影响以及用户行为数据稀疏性对协同过滤推荐的影响。

然而,大部分的推荐系统依赖于用户对项目的历史评分记录来预测新的商品的打分,但是针对一些商品,如酒店餐馆等的情况,用户只有对商品的点评记录,没有打分的情况则没有好的办法进行处理。

发明内容

本发明的目的在于克服现有技术的缺点与不足,提供了一种基于深度学习的商品推荐方法及系统。

本发明通过以下的方案实现:一种基于深度学习的商品推荐方法,包括以下步骤:

S1:通过爬虫抓取商品的评论数据;

S2:对评论数据进行数据预处理;

S3:对数据进行特征提取;

S4:对商品评论进行细粒度分析;

S5:对商品评论进行量化打分;

S6:结合协同过滤进行商品推荐。

作为本发明的进一步改进,所述步骤S2中,具体包括以下步骤:

S21:对评论数据进行分词;

S22:进行停用词过滤;

S23:对词性进行标注。

作为本发明的进一步改进,所述步骤S3具体为:通过词频分析工具统计商品评论语料中所有名词出现的频率。

作为本发明的进一步改进,所述步骤S4中具体包括以下步骤:

S41:对商品评论文本单词进行向量化;

S42:通过深度递归网络的细粒度情感分析模型进行情感分析。

作为本发明的进一步改进,所述步骤S5中具体为:构造矩阵将对应词语模糊量化和构造情感词语所对应的模糊集合,将商品评论转化为评分矩阵R[u][i],标志用户u对物品i的评分。

本发明还提供了一种基于深度学习的商品推荐系统,其包括:

数据抓取模块,用于通过爬虫抓取商品的评论数据;

预处理模块,用于对评论数据进行数据预处理;

特征提取模块,用于对数据进行特征提取;

细粒度分析模块,用于对商品评论进行细粒度分析;

量化打分模块,用于对商品评论进行量化打分;

推荐模块,用于结合协同过滤进行商品推荐。

作为本发明的进一步改进,所述预处理模块包括:

分词子模块,用于对评论数据进行分词。

停用词过滤子模块,用于进行停用词过滤。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州华企联信息科技有限公司,未经广州华企联信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710271969.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top