[发明专利]一种基于网页浏览的用户兴趣建模方法有效
| 申请号: | 201110447908.3 | 申请日: | 2011-12-27 |
| 公开(公告)号: | CN102402766B | 公开(公告)日: | 2017-07-28 |
| 发明(设计)人: | 韩军 | 申请(专利权)人: | 北京京东尚科信息技术有限公司 |
| 主分类号: | G06F17/00 | 分类号: | G06F17/00 |
| 代理公司: | 上海弼兴律师事务所31283 | 代理人: | 薛琦 |
| 地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 网页 浏览 用户 兴趣 建模 方法 | ||
技术领域
本发明涉及计算机技术领域,尤其涉及到基于网页浏览的用户兴趣建模方法。
背景技术
近年来,随着计算机与网络技术的进步,电子商务得到了快速发展。用户通过网络能够采购到各类商品。为了帮助客户尽快找到合适的商品,同时也为了做商品推广,电子商务网站都会集成一个推荐系统自动为客户生成商品推荐。在商品推荐系统中,为了能准确地了解用户的兴趣特征从而更有针对性地做商品推荐,需要对用户的兴趣建立数学模型。
目前,大多数的推荐系统都侧重于根据用户的购买历史和浏览历史来做简单的商品推荐,没有针对单个用户建立其兴趣模型。其缺点显而易见,一方面,如果用户已经购买了某种商品,这短期内用户对此类商品的需求就下降了,如果此时仍然推荐此类商品,则达不到商品推广的目的;另一方面,仅根据浏览历史做的商品推荐则仅仅将用户局限于某几个商品之中,无法深入发掘用户尚未浏览的其他商品。在缺乏完善的用户兴趣模型下做的商品推荐,在效果上不尽如人意。
发明内容
有鉴于此,一种能从各个方面反映用户兴趣的数学模型是十分有益的。
为了解决上述问题,本发明提供了一种基于网页浏览的用户兴趣建模方法,其技术方案包括如下步骤:
1.根据电子商务网站的商品分类目录结构,将目录层次的最后一级目录作为用户的兴趣点,一个兴趣点包含该目录下的所有商品页面;
2.用户的兴趣模型包括三个维度:空间兴趣维度P、时间兴趣维度T、兴趣转移维度C,通过用户在网站的浏览记录,计算上述三个维度;
3.空间兴趣维度P用于描述用户兴趣的倾向性,其表示为:
P={(W0,IP0),(W1,IP1),...,(Wn,IPn)}
其中,Wi代表用户访问兴趣点i的总次数,IPi描述的是用户对兴趣点i中每个商品的兴趣矢量,其表达式为:
IPi=[w0,w1,...,wm]
其中,wj代表用户对兴趣点中商品j的兴趣度;
4.时间兴趣维度T用于描述用户的长期兴趣和短期兴趣,其表示为:
T={(LT0,ST0),(LT1,ST1),...,(LTn,STn)}
其中,LTi代表用户对兴趣点i访问的总在线时间,STi代表用户最近访问兴趣点的密度;
5.兴趣转移维度C用于描述用户在不同兴趣点之间的相关性,其表达式为:
Ix,Iy代表两个不同的兴趣点x和y,P(Ix,Iy)代表用户的会话同时包含兴趣点x和y的概率,P(Ix)代表用户的会话包含兴趣点x的概率,P(Iy)代表用户的会话包含兴趣点y的概率,C(Ix,Iy)反映了兴趣点x和y的相关性,值大于1表示正相关,值小于1表示负相关,值等于1表示不相关。
其中,n+1代表兴趣点的总个数,m+1代表每个兴趣点中的商品的总个数,i为整数,且0≤i≤n,j为整数,且0≤j≤m。
本发明还可以通过下述方法增强建模效果:
用户对兴趣点中商品的兴趣度wj的计算方法如下:
其中,CNT(j)代表用户对兴趣点中商品j的访问次数,PU代表该商品所属兴趣点所拥有的用户总数,IPUj代表该商品所拥有的用户总数。
用户对兴趣点i访问的总在线时间的计算公式为:
其中,a代表用户访问的次数,tk代表第k次访问所花费的时间。
用户对兴趣点i的最近访问兴趣密度的计算公式为:
其中,θ代表一个固定的时间间隔,tkθ代表从当前时间开始往前kθ的时间范围内,用户访问兴趣点i的总时间,b是一个参数,用于设定访问兴趣密度计算的时间跨度范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司,未经北京京东尚科信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110447908.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:光碟机与计算机系统及其控制方法
- 下一篇:决明子枕芯





