[发明专利]一种网页标题分析的方法和系统有效
申请号: | 201110291388.1 | 申请日: | 2011-09-30 |
公开(公告)号: | CN102306201A | 公开(公告)日: | 2012-01-04 |
发明(设计)人: | 邢飞 | 申请(专利权)人: | 邢飞 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100075 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网页 标题 分析 方法 系统 | ||
技术领域
本发明涉及互联网数据分析领域,尤其涉及网站流量数据分析领域。
背景技术
HTTP referrer:HTTP协议表头的一个字段,记录该HTTP请求的来源网页URL。当用户浏览网站时,用户在网页A通过点击超链接要进入到下一个页面B时,浏览器会发送一个HTTP请求给网站服务器,该请求中,包含了要访问的网页URL B,和referrer信息A。
网页标题:通常地,在网页html代码中“<title>”和“</title>”中包含的文字即网页标题。更精确地,对于网页内容中包含有明显的加粗或大号字体的文字,且这段文字概括了整个网页内容,也被定义为网页标题。例如:电子商务网站中一个商品详情页面中商品的全名即为该网页标题;一篇新闻网页中新闻的题目即为改网页标题。
搜索引擎优化:搜索引擎是互联网用户获取信息的重要入口,用户在搜索引擎中输入查询词找到需要的资料。为了提升网站中网页被用户找到的几率,对网页进行合理地搜索引擎优化是必不可少的。当用户搜索与某网页相关的查询词时,经过优化的网页在搜索结果页中展示并且更靠前,进而增加了该网页的浏览量。其中,网页的标题是影响搜索引擎排名的重要因素,因此,对网页标题的优化是搜索引擎优化中的重要环节。这里提到的搜索引擎,包括但不限于网页搜索引擎、商品搜索引擎、电子商务网站中站内商品搜索引擎。
分词器:可以自动识别句子或段落中词的边界的装置,可以将句子或段落切分成一个一个的词。
目前,对网页标题的优化方法主要是根据网页的主体内容,人为或辅助以词表来判断标题中词的保留或删除,没有方法能够结合用户的搜索行为,准确且直观地对网页标题进行分析。
发明内容
针对现有技术上存在的缺陷和不足,本发明提供了一种网页标题分析的方法,能够根据该页面搜索来源关键词,对标题中的每个词进行分析并以可视化形式展示,以帮助网页内容提供者更好的对网页进行搜索引擎优化,从而提升了网页被用户找到的几率。
为了达到上述目的,本发明的方法,包括以下步骤:
1.记录网页的每一个用户访问,将referrer信息中包含有搜索引擎关键词的部分进行提取并记录;
2.使用分词器,对所有的搜索关键词或指定时间区间内的搜索关键词与网页标题进行分词;
3.将每个网页下对应的指定时间区间内的搜索关键词进行归并统计,得到标题中每个词对应的搜索关键词的次数,并以直观的形式展示;
上述的方法中,步骤1进一步包括:
11.根据预先定义的规则库,判断referrer信息类型,如果是搜索引擎查询类,则继续执行12,如果不是,则不记录该条信息;
12.根据referrer信息匹配到的规则,提取对应的搜索关键词信息并解码、记录;
上述的方法中,步骤3进一步包括:
31.选取指定时间内的搜索关键词的分词后的结果;
32.对每个搜索关键词分词后的结果进行搜索次数归并统计;
33.根据32中的统计结果,对网页标题中的每个词进行匹配,得到标题中每个词在特定时间段的搜索次数,未匹配上的词次数记作0;
34.对33中的统计结果进行渲染,并以直观的形式展示。
附图说明
图1为根据本发明的网页标题分析方法流程图;
图2为根据本发明的网页标题分析系统实际效果截图。
具体实施方式
下面结合附图1对本发明做进一步详细说明:
1.对网页的每一个用户访问,记录该商品的URL、referrer信息及访问时间。根据预先设定一个referrer信息分类规则库,将referrer信息与规则库中规则进行匹配,如果匹配成功,将包含有搜索引擎关键词的部分进行提取、URL编码转换并记录。这里提及的referrer信息分类规则库,可以用来判断referrer信息是否属于搜索引擎查询,如果是搜索引擎查询,并提供查询词提取规则,以供提取搜索查询词。
例如,referrer信息分类规则库中包含如下规则:
http://s.taobao.com/search?q=*
http://search.360buy.com/Search?keyword=*
http://www.baidu.com/baidu?word=*
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于邢飞,未经邢飞许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110291388.1/2.html,转载请声明来源钻瓜专利网。