[发明专利]一种基于网页浏览的用户兴趣建模方法有效
| 申请号: | 201110447908.3 | 申请日: | 2011-12-27 |
| 公开(公告)号: | CN102402766B | 公开(公告)日: | 2017-07-28 |
| 发明(设计)人: | 韩军 | 申请(专利权)人: | 北京京东尚科信息技术有限公司 |
| 主分类号: | G06F17/00 | 分类号: | G06F17/00 |
| 代理公司: | 上海弼兴律师事务所31283 | 代理人: | 薛琦 |
| 地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 网页 浏览 用户 兴趣 建模 方法 | ||
1.一种基于网页浏览的用户兴趣建模方法,其特征在于,包括如下步骤:
1)根据电子商务网站的商品分类目录结构,将目录层次的最后一级目录作为用户的兴趣点,一个兴趣点包含该目录下的所有商品页面;
2)用户的兴趣模型包括三个维度:空间兴趣维度P、时间兴趣维度T、兴趣转移维度C,通过用户在网站的浏览记录,计算上述三个维度;
3)空间兴趣维度P用于描述用户兴趣的倾向性,其表示为:
P={(W0,IP0),(W1,IP1),...,(Wn,IPn)}
其中,Wi代表用户访问兴趣点i的总次数,IPi描述的是用户对兴趣点i中每个商品的兴趣矢量,其表达式为:
IPi=[w0,w1,...,wm]
其中,wj代表用户对兴趣点中商品j的兴趣度;
4)时间兴趣维度T用于描述用户的长期兴趣和短期兴趣,其表示为:
T={(LT0,ST0),(LT1,ST1),...,(LTn,STn)}
其中,LTi代表用户对兴趣点i访问的总在线时间,STi代表用户最近访问兴趣点的密度;
5)兴趣转移维度C用于描述用户在不同兴趣点之间的相关性,其表达式为:
Ix,Iy代表两个不同的兴趣点x和y,P(Ix,Iy)代表用户的会话同时包含兴趣点x和y的概率,P(Ix)代表用户的会话包含兴趣点x的概率,P(Iy)代表用户的会话包含兴趣点y的概率,C(Ix,Iy)反映了兴趣点x和y的相关性,值大于1表示正相关,值小于1表示负相关,值等于1表示不相关;
其中,n+1代表兴趣点的总个数,m+1代表每个兴趣点中的商品的总个数,i为整数,且0≤i≤n,j为整数,且0≤j≤m。
2.根据权利要求1所述的方法,其特征在于,用户对兴趣点中商品的兴趣度wj的计算方法如下:
其中,CNT(j)代表用户对兴趣点中商品j的访问次数,PU代表该商品所属兴趣点所拥有的用户总数,IPUj代表该商品所拥有的用户总数。
3.根据权利要求1所述的方法,其特征在于,用户对兴趣点i访问的总在线时间的计算公式为:
其中,a代表用户访问的次数,tk代表第k次访问所花费的时间。
4.根据权利要求1或3所述的方法,其特征在于,用户对兴趣点i的最近访问兴趣密度的计算公式为:
其中,θ代表一个固定的时间间隔,tkθ代表从当前时间开始往前kθ的时间范围内,用户访问兴趣点i的总时间,b是一个参数,用于设定访问兴趣密度计算的时间跨度范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司,未经北京京东尚科信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110447908.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:光碟机与计算机系统及其控制方法
- 下一篇:决明子枕芯





