[发明专利]一种基于页面标题的网页流量数据的统计方法及装置在审
申请号: | 201611076612.4 | 申请日: | 2016-11-29 |
公开(公告)号: | CN108121729A | 公开(公告)日: | 2018-06-05 |
发明(设计)人: | 王科;王晓;刘荣明 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;姜劲 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 流量数据 页面标题 目标网页 网页 统计 页面内容 聚合 直观 采集 分组 | ||
本发明提供一种基于页面标题的网页流量数据的统计方法及装置,其中,该方法包括:采集该网页的包括页面标题的流量数据;根据该页面标题,对该流量数据进行分组统计。通过本发明提供的基于页面标题的网页流量数据的统计方法及装置,能够通过页面标题直观的了解当前统计的流量数据的页面内容,如果一个目标网页存在对应多个URL的情况,还可以从整体上对目标网页进行流量聚合统计,以达到全面知晓目标网页的流量数据。
技术领域
本发明涉及计算机软件领域,具体涉及一种基于页面标题的网页流量数据的统计方法及装置。
背景技术
在现有技术中,对网页的流量数据的浏览通常是通过URL来查看流量数据,而对流量数据的统计方法则是首先通过埋点采集流量数据,然后识别数据库中的URL对应的流量数据,最后在前端页面实现相关流量数据的统计信息的展示。
由于网页URL完全是由字母数字符号等组成,并且没有实际的意义,因此对于查询和浏览流量数据的人员来说,这些人员无法仅仅通过URL得知具体对应的是哪个网页的流量数据。如果想知道一个URL对应的网页内容,通常需要浏览人员把这个URL粘贴至浏览器查看这个URL是针对什么页面进行的流量统计。
此外,如果一个网页从不同的渠道引流过来往往对应多个URL,而目前的统计方法不会针对多个URL进行聚合统计,从而能够直观反映一个网页的整体实际流量情况。即使通过人工或者正则表达式对所有的情况后枚举完才能确保完全统计,但是这种方法十分费时并且依然存在遗漏的可能。
发明内容
有鉴于此,本发明的目的在于提供一种基于页面标题的网页流量数据的统计方法及装置,以解决现有技术中存在的上述缺陷。
本发明的技术方案是提供一种基于页面标题的网页流量数据的统计方法,该方法包括:
采集所述网页的包括页面标题的流量数据;
根据所述页面标题,对所述流量数据进行分组统计。
可选地,该方法还包括:通过埋点或无埋点方式采集所述网页的流量数据,并且提取所述网页的HTML源码中的title标签中的所述页面标题。
可选地,该方法还包括:在采集所述网页的包括页面标题的流量数据之后,将所述流量数据存储至数据库中。
可选地,该方法还包括:当请求出现异常只获得页面URL或页面标题其中之一时,通过查询先前存储在数据库中的URL和标题对,找出与已获取的页面URL或页面标题相对应的页面标题或页面URL。
可选地,该方法还包括:在根据所述页面标题,对所述流量数据进行分组统计的步骤之后,对所述页面标题的所述流量数据进行展示。
本发明还提供一种基于页面标题的网页流量数据的统计装置,该装置包括:
数据采集模块,用于采集所述网页的包括页面标题的流量数据;
数据统计模块,用于根据所述页面标题,对所述流量数据进行分组统计。
可选地,所述数据采集模块还用于:通过埋点或无埋点方式采集所述网页的流量数据,并且提取所述网页的HTML源码中的title标签中的所述页面标题。
可选地,该装置还包括:数据存储模块,用于将所述流量数据存储至数据库中。
可选地,该装置还包括:数据查询模块,用于当请求出现异常只获得页面URL或页面标题其中之一时,通过查询先前存储在数据库中的URL和标题对,找出与已获取的页面URL或页面标题相对应的页面标题或页面URL。
可选地,该装置还包括:数据展示模块,用于对所述页面标题的所述流量数据进行展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611076612.4/2.html,转载请声明来源钻瓜专利网。