[发明专利]一种推荐对象的方法和系统有效
申请号: | 201911421030.9 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111159578B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | 刘正夫 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q30/0601;G06F18/2321;G06F18/243;G06F18/27;G06N20/20 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 曾世骁;王兆赓 |
地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 推荐 对象 方法 系统 | ||
提供了一种推荐对象的方法和系统,所述方法包括:获取对象数据集和用户行为数据集,其中,对象数据集包括每个对象与在该对象上产生行为的用户的序列信息,用户行为数据集包括每个用户与该用户在其上产生行为的对象序列信息;基于用户行为数据集将全部用户划分为活跃用户和非活跃用户,基于对象数据集将全部对象划分为活跃对象和非活跃对象;对活跃对象和非活跃对象进行聚类以形成多个对象类别;对活跃用户和非活跃用户进行聚类以形成多个用户类别;对于每个目标用户,根据目标用户的行为数据、多个对象类别和目标用户所属的用户类别采用协同过滤方法执行召回以构建目标用户的候选集;以及对候选集进行排序,基于排序结果向所述目标用户进行推荐。
技术领域
本发明涉及数据挖掘领域,提供了一种推荐对象的方法和系统。
背景技术
在大数据时代,每天都会产生大量的数据。例如,这些数据包含了不同用户的特征、不同对象(例如,商品、服务、虚拟商品等)的特征以及用户与对象之间的关联信息(例如,购买/点击/搜索/收藏)和/或序列信息(例如,按时间排列的购买/点击/搜索/收藏的顺序)。用合适的方法对大量的数据进行分析,构建推荐系统,从而为不同的用户推荐不同的商品,进而更好的服务用户。
目前的推荐系统分为“召回”和“排序”两个模块。“召回”指的是:为了减少“排序”步骤的计算量,从大量对象(例如,数量级为千万级别的商品)中选出一部分对象(例如,数量级为百级别的商品)。“排序”则是按照用户与对象的匹配程度进行打分,然后再按照分数来排序,将分数高的对象推荐给对应的用户。
召回模块通常采用“协同过滤”方法,将类似的对象推荐给相似的用户。因此“协同过滤”需要计算不同用户之间、不同对象之间的距离。这就需要将用户和对象用向量表示,对象转向量(item2vec)算法和用户转向量(user2vec)算法是一种基于单词转向量(word2vec)的算法,可以将对象/用户转换为稠密的向量。然而,在实际应用中,只有少量对象/用户属于活跃对象/用户,存在有效的行为数据并满足建模要求。有大量对象/用户并没有足够的行为数据来建模,传统的item2vec算法和user2vec算法只适合对头部活跃的对象/用户建模,而对于长尾对象/用户并不能取得较好的效果。
此外,由于item2vec算法和user2vec算法得到的向量并不能覆盖到所有的对象和用户,不能做泛化推理,所以传统的item2vec算法和user2vec算法将对象和用户转换为向量之后,通常仅应用于“召回”模块,而无法应用于“排序”模块。
发明内容
本发明的目的在于提供一种推荐对象的方法和系统。更具体地,提供了一种基于对象转向量(item2vec)模型和用户转向量(user2vec)模型的推荐系统,以便可以更加充分的利用用户的行为信息。
本发明提供了一种推荐对象的方法,所述方法包括:获取对象数据集和用户行为数据集,其中,所述对象数据集包括每个对象与在该对象上产生行为的用户的序列信息,所述用户行为数据集包括每个用户与该用户在其上产生行为的对象的序列信息;基于所述用户行为数据集将全部用户划分为活跃用户和非活跃用户,基于所述对象数据集将全部对象划分为活跃对象和非活跃对象;对活跃对象进行聚类并且对非活跃对象进行聚类以形成多个对象类别;对活跃用户进行聚类并且对非活跃用户进行聚类以形成多个用户类别;对于每个目标用户,根据所述目标用户的行为数据、所述多个对象类别和所述目标用户所属的用户类别采用协同过滤方法执行召回以构建所述目标用户的候选集;以及对所述候选集进行排序,基于排序结果向所述目标用户进行推荐。
在根据发明构思的示例性实施例中,所述对活跃对象进行聚类的步骤包括:选用连续词袋模型方法基于所述活跃用户的用户行为数据集构建对象训练样本;基于所述对象训练样本训练对象转向量模型以得到对象向量;以及基于所述活跃对象的对象向量对所述活跃对象进行聚类。
在根据发明构思的示例性实施例中,所述对非活跃对象进行聚类的步骤包括:基于所述非活跃对象的基础特征对所述非活跃对象进行聚类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911421030.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于聚类分析的客户分群实现方法
- 下一篇:大件货物运输线路规划系统及方法