[发明专利]用于基于FastText模型向用户推荐商品的方法、装置、电子设备及存储介质在审
申请号: | 201710045166.9 | 申请日: | 2017-01-19 |
公开(公告)号: | CN108335127A | 公开(公告)日: | 2018-07-27 |
发明(设计)人: | 欧辉思;郭文涛 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q30/06;G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 杨姗 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商品向量 特征向量 用户推荐 浏览 相似度算法 存储介质 电子设备 特征信息 向量确定 序列生成 向量 | ||
本公开公开了一种用于基于FastText模型向用户推荐商品的方法,包括:将所述用户正在浏览的第一商品的商品向量和特征向量组合为最终向量;以及利用相似度算法根据所述最终向量确定与所述第一商品相似的多个推荐商品,其中,所述商品向量是利用FastText模型中的Word2Vec模块,根据与所述第一商品相关的一个或多个商品浏览序列生成的;以及所述特征向量是利用FastText模型中的Ngrams模块,根据与所述第一商品相关的特征信息生成的。
技术领域
本公开总体上涉及互联网技术领域,更具体地,涉及用于基于FastText模型向用户推荐商品的方法、装置、电子设备及存储介质。
背景技术
在推荐系统中,存在很多基于用户的商品浏览序列的推荐场景。可以认为,同一个用户的商品浏览序列内的商品是相互关联的。基于用户的商品浏览序列的推荐,即根据浏览序列挖掘商品间的关联性,可以根据每个商品挖掘出与之最相关的商品集合。可以认为,用户在浏览某个商品之后,会大概率有兴趣浏览这个商品的最相关商品集合内的商品,于是可以将这样的商品集合推荐给当前正在浏览以及历史浏览过该商品的用户。
现有的基于用户商品浏览序列推荐方法主要为字转向量模型(Word2Vec)。Word2Vec将每个商品(由可用商品ID表示)当作一个Word(字),并且每个用户的商品浏览序列当作一个Sentence(句子)。对每个Word,Word2Vec选中包含该Word上下文(前后Word)的窗口,该Word与窗口中的其他Word有相关性,可根据该Word对其上下文Word进行预测。通过不断输入用户的商品浏览序列(Sentence),依据上述方法可对每个商品训练出该商品的定长商品向量。
在得到所有商品各自的商品向量之后,根据余弦相似度算法、皮尔逊相似度算法等相似度计算方法计算出每个商品的最相似的商品集合。图1示出了Word2Vec的具体结构图。商品向量(如表1所示)的维度相同,比如100维。维度可以在初始时人为指定。向量值为浮点数。
表1
现有基于用户商品浏览序列的推荐方法Word2Vec的流程如下:从数据库、日志中筛选出所有用户的商品浏览序列集合;根据Word2Vec训练出商品的商品向量;计算商品向量的相似度,获得每个商品最相似的商品集合;以及向浏览过或正在浏览特定商品的用户推荐该商品的相似商品集合。
然而,现有基于用户商品浏览序列的推荐方法Word2Vec具有以下缺点:首先,Word2Vec只利用用户的商品浏览序列训练商品向量,没有利用每个商品本身的属性特性(如商品标题、商品属性如类别等)信息,准确性不足;其次,对浏览次数很少的商品或新加入商品,因浏览序列很少,无法通过Word2Vec训练得到准确的商品向量,即Word2Vec对长尾物品和冷启动物品的推荐效果差,推荐多样性和准确性不足。
发明内容
鉴于此,本公开提出了用于基于FastText模型向用户推荐商品的方法、系统和计算机可读介质。
在本公开的第一方面,提供了一种基于FastText模型向用户推荐商品的方法,包括:
将所述用户正在浏览的第一商品的商品向量和特征向量组合为最终向量;以及
利用相似度算法根据所述最终向量确定与所述第一商品相似的多个推荐商品,
其中,所述商品向量是利用FastText模型中的Word2Vec模块,根据与所述第一商品相关的一个或多个商品浏览序列生成的;以及
所述特征向量是利用FastText模型中的Ngrams模块,根据与所述第一商品相关的特征信息生成的。
优选地,所述特征信息包括标题信息和属性信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710045166.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于云端分销宝电商系统
- 下一篇:基于区块链技术的积分处理系统