[发明专利]基于物品的推荐方法及系统有效

专利信息
申请号: 201310703736.0 申请日: 2013-12-18
公开(公告)号: CN103700007B 公开(公告)日: 2017-10-31
发明(设计)人: 赵影;张霞;赵立军;任英杰 申请(专利权)人: 东软集团股份有限公司
主分类号: G06Q30/02 分类号: G06Q30/02
代理公司: 北京鸿元知识产权代理有限公司11327 代理人: 陈英俊
地址: 110179 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 物品 推荐 方法 系统
【说明书】:

技术领域

发明涉及基于物品的推荐技术领域,更为具体地,涉及一种基于物品的推荐方法及系统。

背景技术

随着电子商务规模的不断扩大、商品个数和种类的快速增长,顾客往往需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关信息和产品的过程无疑会使淹没在信息过载问题中的消费者不断流失。

个性化推荐是根据用户的兴趣特点和购买行为向用户推荐用户感兴趣的信息和商品的推荐方法,这种推荐方法可以通过分析用户的习惯、历史记录等数据,较为准确地向用户提供感兴趣的信息,如视频、书籍、音乐、商品、新闻等,在很大程度上解决了“信息过载”和“信息迷失”带来的各种问题。在推荐资源的精确度足够高的情况下,个性化推荐还是提高用户粘性的一个非常好的途径。

在个性化推荐技术领域,上述推荐的信息可概括为物品,目前基于物品的个性化推荐算法主要有以下两种:

(1)协同过滤算法:通过用户对物品的历史评价计算物品间的相似度a,然后利用相似度a来预测用户对未评价物品的评分。从数学模型的角度来看,该算法可理解为令线性回归模型y=ax+b中的b=0的情况。协同过滤算法实际上仅考虑了物品间的相似度对推荐结果的影响。

(2)Slopeone算法:通过用户对物品的历史评价计算物品间的差值b,然后利用差值b来预测用户对未评价物品的评分。从数学模型的角度来看,该算法可理解为令线性回归模型y=ax+b中的a=1的情况。Slopeone算法实际上仅考虑了物品间的差对推荐结果的影响。

图1为传统的基于物品的推荐方法流程图。

如图1所示,协同过滤算法和Slopeone算法的推荐过程包括:步骤S110物品推荐开始、步骤S120用户历史评价、步骤S130计算物品的相似度或平均值、步骤S140计算为评价物品预测值、步骤S150按预测值对未评价物品降序排列、步骤S160给用户推荐排名前N的物品、步骤S170物品推荐结束。可知传统的物品推荐方法中都采用了线性回归的“简化版本”,即只考虑相似度或只考虑平均差。因为在海量用户和物品的情况下,y=ax+b模型的计算复杂度非常高,很难满足实时推荐的要求,因此,不得不牺牲一定的模型准确性来提高运算效率。

在海量用户物品情况下,使用y=ax+b模型进行推荐存在以下三个问题:

问题一:图1传统的基于物品的推荐方法流程图中所示步骤S130中对y=ax+b模型进行拟合的计算复杂度很高。

因为,传统的y=ax+b模型的计算过程为:

对于用户—物品矩阵:

其中任意一组itemj的值,用其他n-1组值来预测它有:

其中,公式1.2可简写为:

Y=XA+B (公式1.3),其中X为m*(n-1)维矩阵

在计算相关系数矩阵A时有:

A=X-1(Y-B) (公式1.4)

此时,当用户—物品矩阵规模达到数百万计时,由于大矩阵求逆本身存在的问题,求解公式1.4基本上是很难实现的。

问题二:热点物品负载不平衡。

传统上为了解决问题一,常规的做法是采用分布式并行计算的方式进行矩阵求解。但在实际的应用场景中,由于热点物品处理复杂度高,会给并行计算带来负载不均衡的问题。传统的并行计算大都实现了基于数据量的负载平衡,将待处理的数据平均分成n个数据块交由不同的线程进行处理,然而由于各个数据块中包含的热点物品数不同,会导致线程的计算负载并不相同,而出现负载不平衡的问题。

问题三:图1传统的基于物品的推荐方法流程图中所示步骤S140中,未评价物品数量过大,计算效率低。

大部分应用场景中物品评价分布中未评价物品的数量较多,均具有长尾的特点。常规方法是依次遍历用户未评价的物品,计算得到每个物品的预测值,这样就会导致计算循环次数高,计算效率低。

在如今信息爆炸的时代,算法的效率和准确性都很重要,因此在保证高效的前提下,如何更为准确的将y=ax+b模型应用于基于物品的推荐领域中,是一个很重要的现实问题。

发明内容

鉴于上述问题,本发明的目的是提供一种基于物品的推荐方法及系统,以解决目前基于物品的推荐方法中存在的计算复杂度高、热点物品负载不平衡以及计算效率低等问题。

根据本发明的一个方面,提供一种基于物品的推荐方法,包括:

获取一个用户的已评价物品,生成所述用户的已评价物品集合,然后从用户的已评价物品集合中取出任意两件物品组成物品对;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310703736.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top