[发明专利]一种基于物品相似度的实时推荐方法有效
申请号: | 201611144613.8 | 申请日: | 2016-12-13 |
公开(公告)号: | CN107066476B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 吴建党;裴少芳;李业北;禹平;孟敬慈 | 申请(专利权)人: | 江苏途致信息科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/06 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 叶涓涓 |
地址: | 210000 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 物品 相似 实时 推荐 方法 | ||
本发明公开了一种基于物品相似度的实时推荐方法,包括预处理历史用户数据的步骤,计算T+1相似矩阵的步骤,收集最新用户数据的步骤,计算用户偏好矩阵的步骤,根据相似矩阵和偏好矩阵计算推荐列表的步骤。本发明能够将登陆和未登录用户的用户标识进行统一,并提出了合理的偏好值计算逻辑,加入时间因素,同时兼顾点击次数两个权重因子,合理地把用户对产品行为操作转换成数值化的喜好值,最大程度上逼近用户的真实喜好,使得用户偏好值的计算更为精确,更为重要的是根据实时获取的用户行为数据进行计算,从而大大提升了推荐效率和计算精确度。
技术领域
本发明属于数据处理技术领域,具体涉及一种基于item-based的实时推荐方法。
背景技术
近年来,随着互联网的飞速发展,网络已经逐渐成为人们选购商品、查询商品信息数据的第一选择。商品种类繁多,信息细化,网站在为用户提供越来越多选择的同时其结构也变得更加复杂,面对不计其数的商品信息,用户经常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品。
为解决这一问题,个性化推荐方法应运而生。传统推荐方法基于物品的协同过滤技术,即是预先根据所有用户的历史偏好数据计算物品之间的相似性,然后把与用户历史访问的物品相类似的topN物品推荐给用户。其具体思想是:先预处理用户访问记录,根据用户物品偏好值计算物品相似矩阵,向用户推荐其偏好物品的相似物品。
但采用传统推荐方法的效果并不理想,不仅推荐准确度不高,而且运算效率低下。究其原因,是因为传统方法有如下几个缺陷:首先由于用户偏好值设置较为简单,导致传统的用户偏好矩阵不能很好地表示用户喜好,这就导致了后续计算的偏差会被持续放大。其次运算时每次都需要计算全量用户,这就重复计算了访问行为实际没有变化的用户推荐列表,导致消耗计算资源较多。此外,目前基于协同过滤技术基本应用于T+1推荐,没有拓展到实时推荐,使得推荐列表更新速度太慢,难以满足实际需求。
发明内容
为解决上述问题,本发明公开了一种基于物品相似度的实时推荐方法,能够将登陆和未登录用户的用户标识进行统一,并定义了更为精确的用户偏好值函数, 更为重要的是根据实时获取的用户行为数据进行计算,从而大大提升了推荐效率和计算精确度。
为了达到上述目的,本发明提供如下技术方案:
一种基于物品相似度的实时推荐方法,包括如下步骤:
步骤A,收集近期用户行为数据,对行为数据进行预处理,当用户在登陆状态,使用userId的Murmur哈希值作为用户标识;用户在非登陆状态下,使用visitor_trace的Murmur哈希值作为用户标识,将用户标识转换成统一的长整型数据值;
步骤B,采用偏好函数模型计算每个用户对浏览商品的偏好值,生成基础用户物品偏好值矩阵,计算物品相似矩阵,
所述偏好函数模型如下:
score =
其中
步骤C,筛选出当前访客的最新行为数据,处理成实时偏好矩阵,结合物品相似矩阵,计算用户推荐列表,包括:
步骤C-1,筛选最新的访客用户的所有行为数据,对数据进行预处理,当用户在登陆状态,使用userId的Murmur哈希值作为用户标识;用户在非登陆状态下,使用visitor_trace的Murmur哈希值作为用户标识,将用户标识统一转换成长整型数值;
步骤C-2,采用偏好函数模型转换每个用户对浏览商品的偏好值,将所有用户对某个物品的偏好值作为一个向量来计算物品之间的相似度,生成实时用户物品偏好矩阵;
步骤C-3,利用步骤B得到的当天已保存的物品相似矩阵,采用矩阵乘法,通过下式计算:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏途致信息科技有限公司,未经江苏途致信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611144613.8/2.html,转载请声明来源钻瓜专利网。