[发明专利]一种基于关键字的电子商务网站商品推荐方法有效
申请号: | 201210050057.3 | 申请日: | 2012-02-29 |
公开(公告)号: | CN102629257A | 公开(公告)日: | 2012-08-08 |
发明(设计)人: | 陈振宇;姚佳玮;杨睿;姚嘉俊;周国兵 | 申请(专利权)人: | 南京大学;南京科泰信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/02 |
代理公司: | 南京天翼专利代理有限责任公司 32112 | 代理人: | 黄明哲 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关键字 电子商务 网站 商品 推荐 方法 | ||
技术领域
本发明属于个性化推荐领域,基于用户在搜索引擎中输入的关键字对电子网站的新用户进行推荐,为一种基于关键字的电子商务网站商品推荐方法。
背景技术
个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,用户需要花费大量的时间才能找到自己需要的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其用户提供完全个性化的决策支持和信息服务。
目前主流的个性化推荐系统主要采用的方法是内容过滤,协同过滤推荐和两者的混合推荐。然而,尽管推荐系统的较之过去已经取得长足的发展,目前这一代的推荐系统依然存在着一些需要更多努力去改进的缺陷。随着市场应用需求的不断改变升级,目前的推荐系统主要存在以下几种明显的弊端:1.新网站的冷启动问题;2.网站新用户没有可供分析的历史数据的问题;3.难以应对变化的用户偏好问题;4.难以应对不断加大的数据集处理问题等等。
本发明方法着力解决的问题便是针对新用户的问题。新用户不存在任何行为记录,难以刻画其特征进行购买预测和商品推荐。所以传统的个性化推荐方法很难对这个问题进行直接应用。
发明内容
本发明所要解决的技术问题是:电子商务网站的用户中新用户的比例很高,很多新用户是在下单购买时才注册登录,一个电子商务网站的新用户既没有历史行为信息数据,如历史评分,浏览,购买等行为,大部分情况也没有人口统计信息数据,如年龄,性别,职业等,所以传统的推荐方法难以满足这个特殊场景的需要。
本发明的技术方案为:一种基于关键字的电子商务网站商品推荐方法,用户在搜索引擎搜索产品,由搜索链接进入电子商务网站,电子商务网站通过脚本采集搜索引擎链接带入的关键字和相关产品信息,所述相关产品包括用户浏览产品和下单产品,所述关键字和相关产品信息作为历史数据保存为服务器上的日志;由关键字之间的关联度得到关键字关联表,由关键字和相关产品之间的索引关系,得到索引数据库,将关键字关联表和索引数据库作为推荐基础;当一个从搜索引擎过来的新用户访问电子商务网站时,解析用户referrer取得关键字,并通过查询关键字关联表获得拓展关键字,通过查找索引数据库得到关键字和拓展关键字对应的商品列表,根据商品权重,推荐权重最高的N件商品。
本发明具体步骤如下:
1)取得原始浏览数据:对日志进行处理,将指定日期范围D内,相同会话下间隔时间不大于时长T的商品页面访问视为一次浏览,日期范围D和时长T由电子商务网站设定,将一次浏览中初次访问的referrer URL中的关键词参数作为关键字字符串Q,处理完日志后,将获得关键字字符串数据作为原始浏览数据;
2)生成关键字-商品索引:对一次浏览记录中的关键字字符串Q进行处理,得到关键字集合K,具体处理方法如下:将关键字字符串Q按照空格分割,并根据预先定义的无用词列表L去除无用词,即:
将一次浏览记录中所有被浏览过的商品记做商品集合P,将(Ki,Pj,Wji)写入索引数据库Index(K,P,W),其中:
Ki∈K,Pj∈P
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学;南京科泰信息技术有限公司,未经南京大学;南京科泰信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210050057.3/2.html,转载请声明来源钻瓜专利网。