[发明专利]一种基于关键字的电子商务网站商品推荐方法有效
申请号: | 201210050057.3 | 申请日: | 2012-02-29 |
公开(公告)号: | CN102629257A | 公开(公告)日: | 2012-08-08 |
发明(设计)人: | 陈振宇;姚佳玮;杨睿;姚嘉俊;周国兵 | 申请(专利权)人: | 南京大学;南京科泰信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/02 |
代理公司: | 南京天翼专利代理有限责任公司 32112 | 代理人: | 黄明哲 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关键字 电子商务 网站 商品 推荐 方法 | ||
1.一种基于关键字的电子商务网站商品推荐方法,其特征是用户在搜索引擎搜索产品,由搜索链接进入电子商务网站,电子商务网站通过脚本采集搜索引擎链接带入的关键字和相关产品信息,所述相关产品包括用户浏览产品和下单产品,所述关键字和相关产品信息作为历史数据保存为服务器上的日志;由关键字之间的关联度得到关键字关联表,由关键字和相关产品之间的索引关系,得到索引数据库,将关键字关联表和索引数据库作为推荐基础;当一个从搜索引擎过来的新用户访问电子商务网站时,解析用户referrer取得关键字,并通过查询关键字关联表获得拓展关键字,通过查找索引数据库得到关键字和拓展关键字对应的商品列表,根据商品权重,推荐权重最高的N件商品。
2.根据权利要求1所述的一种基于关键字的电子商务网站商品推荐方法,其特征是具体步骤如下:
1)取得原始浏览数据:对日志进行处理,将指定日期范围D内,相同会话下间隔时间不大于时长T的商品页面访问视为一次浏览,日期范围D和时长T由电子商务网站设定,将一次浏览中初次访问的referrerURL中的关键词参数作为关键字字符串Q,处理完日志后,将获得关键字字符串数据作为原始浏览数据;
2)生成关键字-商品索引:对一次浏览记录中的关键字字符串Q进行处理,得到关键字集合K,具体处理方法如下:将关键字字符串Q按照空格分割,并根据预先定义的无用词列表L去除无用词,即:
将一次浏览记录中所有被浏览过的商品记做商品集合P,将(Ki,Pj,Wji)写入索引数据库Index(K,P,W),其中:
Ki∈K,Pj∈P
权重Wji的计算中,C(Ki)表示关键字Ki在所有关键字字符串中的出现次数;C(Ki,Pj)表示关键字Ki和商品Pj在所有浏览记录中同时出现的次数;
3)生成关键字关联表:针对步骤2)中生成的所有关键字,根据jaccard公式计算两两之间的关联度,如下:
A(Km,Kn)表示关键字Km和关键字Kn之间的关联度,C(Km)为Km在历史记录中的出现次数,C(Kn)为Kn在历史记录中的出现次数,C(Km,Kn)为关键字Km和Kn共同出现在一条记录中的次数,当A(Km,Kn)大于预先设定的阀值AT时,将(Km,Kn,A(Km,Kn))写入关键字关联表Assoc(K,K,A);
4)取得关键词集合:当新用户访问网站时,通过脚本尝试采集其搜索引擎带入的关键字KS,方法同步骤2),记取得的关键字集合为如果无法取得关键字,则该用户不属于推荐目标;
5)扩展关键字:根据关键字关联表生成扩展关键字集合方法如下:
Expand(Km)=∪{Kn|(Km,Kn,A(m,n))∈Assoc(K,K,A)}
k′为扩展的关键字;
6)计算商品权重:由索引数据库Index(K,P,W)构造二部图G(V,E),其中:
V=K∪P
E=∪{(Ki,Pj)|(Ki,Pj,Wji)∈(K,P,W)}
从二部图中取出所有和相关的边E’:
根据E’计算商品的权重:
其中α(Ki)是由电子商务网站设定的、用于区别来自和不同关键字的调整参数,
7)排序:将步骤6)中计算得到的W(Pj)按降序排列,推荐权重最高的N个商品。
3.根据权利要求1或2所述的一种基于关键字的电子商务网站商品推荐方法,其特征是所述脚本为JavaScript脚本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学;南京科泰信息技术有限公司,未经南京大学;南京科泰信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210050057.3/1.html,转载请声明来源钻瓜专利网。