[发明专利]确定网站页面地址流转率的方法、优化方法及其装置有效
申请号: | 201210441412.X | 申请日: | 2012-11-07 |
公开(公告)号: | CN103810184B | 公开(公告)日: | 2017-09-26 |
发明(设计)人: | 毕江华;訚赛华;赵雪波 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同达信恒知识产权代理有限公司11291 | 代理人: | 郭润湘 |
地址: | 英属开曼群岛大开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 网站 页面 地址 流转 方法 优化 及其 装置 | ||
1.一种确定网站页面地址流转率的方法,其特征在于,包括:
获取各个用户的会话对应的访问网站页面地址的日志,每个日志中包括用户访问网站页面地址时间、前一个访问网站页面地址和当前访问网站页面地址;
根据获取的日志中的用户访问网站页面地址时间、前一个访问网站页面地址和当前访问网站页面地址,生成各个用户对应的各访问序列,每个访问序列中包含以访问时间先后排列的各网站页面地址;
将生成的各个用户对应的各访问序列与预设的访问序列拆分后的多个子访问序列分别进行匹配,得到预设的访问序列中每级节点的访问次数和访问人数,所述预设的访问序列中包含依顺序排列的多级节点,每级节点对应一个网站页面地址;
计算预设的访问序列中下一节点的访问次数与上一节点的访问次数的比值,得到预设的访问序列中上一节点到下一节点的转化率;并计算预设的访问序列中下一节点的访问人数与上一节点的访问人数的比值,得到预设的访问序列中上一节点到下一节点的访问率,以及基于所述转化率和所述访问率,确定预设的访问序列中各上一节点到下一节点的流转率。
2.如权利要求1所述的方法,其特征在于,根据获取的日志中用户访问网站页面地址时间、前一个访问网站页面地址和当前访问网站页面地址的信息,生成各个用户对应的各访问序列,具体包括:
针对每个用户的每个会话,按照访问时间对每个会话对应的日志进行排序;
将排序后的日志中的当前访问网站页面地址和前一个访问网站页面地址进行串接,得到与日志中访问网站页面地址路径相对应的访问树;
按照从起始节点到各个结束节点的顺序,将得到的访问树依次拆分生成该用户对应的各访问序列,起始节点对应起始访问的网站页面地址;结束节点对应结束访问的网站页面地址。
3.如权利要求2所述的方法,其特征在于,在生成各个用户对应的各访问序列之后,与预设的访问序列拆分后的多个不重复的子访问序列进行匹配之前,还包括:
所述预设的访问序列每级节点对应的网站页面地址分别对应一不同的字符串;
针对每个用户对应的每个访问序列,将该用户对应的该访问序列中的网站页面地址转换为对应的字符串;
若没有对应的字符串,则将该网站页面地址转换为设定的字符串。
4.如权利要求3所述的方法,其特征在于,将生成的各个用户对应的各访问序列与预设的访问序列拆分后的多个不重复的子访问序列进行匹配,得到预设的访问序列中每级节点的访问次数和访问人数,具体包括:
针对每个用户,将该用户对应的各访问序列中的字符串,分别与拆分后的每个子访问序列进行匹配,所述子访问序列为一组字符串;
针对每个用户对应的每个访问序列,若该访问序列中的字符串与子访问序列匹配成功,则将子访问序列对应的访问次数加1,继续进行下一个访问序列中的字符串的匹配,直到用户对应的访问序列中的字符串匹配结束,得到各子访问序列对应的访问次数;
若每个用户对应的各访问序列中,至少存在一个访问序列中的字符串能够与各子访问序列中任一个匹配成功,则将该子访问序列对应的访问人数加1,继续匹配下一个用户,直到用户匹配结束,得到各子访问序列对应的访问人数;
将得到的预设的访问序列中前X级节点组成的子访问序列对应的访问次数和访问人数确定为所述预设的访问序列中第X级节点的访问次数和访问人数,其中,X小于等于预/设的访问序列中节点的总数,X为整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210441412.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:蒸汽清洗设备及其清洗方法
- 下一篇:一种提醒方法和电子设备