[发明专利]电子商务网站相关商品推荐系统及其方法无效
申请号: | 200710301709.5 | 申请日: | 2007-12-25 |
公开(公告)号: | CN101206752A | 公开(公告)日: | 2008-06-25 |
发明(设计)人: | 曹杨;庄洪波;王洪涛;张研 | 申请(专利权)人: | 北京科文书业信息技术有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06F17/30;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100011北京市东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子商务 网站 相关 商品 推荐 系统 及其 方法 | ||
技术领域
本发明涉及电子商务网站的相关商品推荐领域,特别是涉及电子商务网站的基于购物行为Item的商品推荐技术和基于内容的商品推荐技术。
背景技术
当今时代是信息技术的时代,互联网在人们的生活中占据了相当大的比重,网上购物就是其中之一。为此,电子商务网站都以获得最大利益为目标,用技术和非技术的方法,增加注册顾客、增加订单量、提供优质的服务。在这些前提下,个性化的商品推荐技术应运而生。
目前,国内的一些推荐技术大多采用比较原始的方法。
最原始的方法是“数据库查询”,通过sql语句找到数据库中和顾客浏览、收藏或是购买的商品有相同作者、相同分类、相同主题等的其他一些商品,推荐给顾客。“问卷反馈”方式,通过提问,让顾客回答一些问题,直接了解顾客的喜好,推荐合适的商品。此外还有“关联规则”等等形式的商品推荐方法。以上这些方法,在推荐的准确性、实时性等方面不够理想,推荐的自动化程度和持久性程度低,缺乏个性化。总结起来,目前国内商品推荐存在以下缺点:
缺乏个性化的推荐。很多的推荐结果是针对所有用户的,或者是针对大部分用户的,不是针对某个用户当前行为的个性化的推荐。这些推荐结果中,可能很多的推荐与某些用户的兴趣并不相符。这是我国电子商务推荐的最大缺点。
推荐的自动化程度低。大多数的推荐功能都需要用户经过一段时间与计算机的交互,输入自己的兴趣信息,然后才能得到结果(“问卷反馈”方式)。
推荐的持久性程度低。目前国内大部分的推荐技术都是建立在当前用户会话基础上的,不能利用用户以前的会话信息,推荐的持久性程度非常低,这也是国内推荐技术的一个主要缺点。
推荐方法单一。所运用的大多数推荐策略基本上就是分类浏览和基于内容的检索,缺乏多种推荐策略的混合使用,尤其是缺少个性化的与非个性化的推荐策略的混合使用。
实时性差,不能在线推荐。有的推荐策略不能做到在线推荐,如信函式推荐,推荐结果不能及时反馈给用户。
推荐的局限性大。大部分只能推荐那些有一定销售量、关注量的商品,而对于那些刚刚上架的新进的商品,无所适从——冷开始问题。
发明内容
为了解决以上问题,给顾客推荐他们可能要购买的商品,同时又能推荐新上架的商品,本发明提供一种简便的在电子商务网站使用的方法:
首先使用基于购物历史挖掘的推荐技术,从顾客的实际购物数据出发进行挖掘,得到的相关推荐商品符合顾客客观的实际的购物趋势和兴趣习惯。
然后,使用基于内容挖掘的自然语言处理相关技术,挖掘商品信息的特征词,把商品表示成相关的信息特征向量,根据不同特征向量间的相似关系得到商品间的相似关系,从而为顾客推荐相关商品。
综上所述,系统由基于购物历史挖掘部分和基于内容挖掘部分构成。第一部分基于购物历史挖掘部分:
如图1所示,本发明系统所使用的功能模块包括:源数据准备模块、数据字段提取模块、计算模型模块、相关商品计算模块。其中的每个部分都是本发明得以实现并成功应用的基础,构成了一个技术系统。
1.源数据准备模块:从数据库中提取一定时间跨度的订单数据、浏览日志、搜索日志等等,能反映“商品-顾客”关系的数据集。
2.数据字段提取模块:提取每条订单中的有用信息,如:购买日期、购买人、购买商品等数据。
3.计算模型模块:通过分析这些数据,建立“商品-顾客”计算模型。
4.相关商品计算模块:按照商品——购买该商品的顾客——该顾客购买其他商品的关系,针对模型中的每个商品,从该商品本身出发,找到购买过它的顾客,再从顾客出发,找到和它存在关系的商品,然后运用核心公式计算这两个商品之间的相似度。
最后,计算完毕后得到每个商品的推荐结果的倒排文件。
具体包括以下步骤:
1)原始数据准备:可以是订单数据,或是浏览日志,搜索日志等等。
2)数据字段提取:取得数据源中有用的计算信息,如时间、人、商品等。
3)建立计算模型:通过分析提取的数据,建立“商品-顾客”计算模型(表示哪些顾客购买了哪些商品、哪些商品被哪些顾客购买过等关系)。
4)相关商品计算模型:用核心计算公式计算每个商品的相关商品集合。
其中,上述步骤4的核心计算公式有很多种选择,比如:
(1)L1-Norm算法:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科文书业信息技术有限公司,未经北京科文书业信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710301709.5/2.html,转载请声明来源钻瓜专利网。