[发明专利]一种网页标题分析的方法和系统有效
申请号: | 201110291388.1 | 申请日: | 2011-09-30 |
公开(公告)号: | CN102306201A | 公开(公告)日: | 2012-01-04 |
发明(设计)人: | 邢飞 | 申请(专利权)人: | 邢飞 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100075 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网页 标题 分析 方法 系统 | ||
1.一种网页标题分析的方法,其特征在于包含如下步骤:
(1)记录网页的每一个用户访问,将referrer信息中包含有搜索引擎关键词的部分进行提取、解码并记录;
(2)使用分词器,对所有的搜索关键词或指定时间区间内的搜索关键词与网页标题进行分词;
(3)将每个网页下对应的指定时间区间内的搜索关键词的分词后的结果进行归并统计,得到标题中每个词对应的搜索次数,并以直观的形式展示。
2.根据权利要求1所述的方法,其特征在于,所述“搜索引擎”是网页搜索引擎、商品搜索引擎、电子商务网站中站内商品搜索引擎中的一种或几种。
3.根据权利要求1所述的方法,其特征在于,所述网页标题是指网页html代码中“<title>”和“</title>”中包含的文字
4.根据权利要求1所述的方法,其特征在于,所述网页标题是指电子商务网站中商品详情网页中所描述商品的全称
5.根据权利要求1所述的方法,其特征在于,所述步骤(1)进一步包括:
(11)根据预先定义的规则库,判断referrer信息类型,如果是搜索引擎查询类,则继续执行步骤(12);如果不是,则不记录该条信息;
(12)根据referrer信息匹配到的规则,将对应的搜索关键词信息提取、解码并记录。
6.根据权利要求1所述的方法,其特征在于,所述步骤(3)进一步包括:
(31)选取指定时间内的搜索关键词的分词后的结果;
(32)对每个搜索关键词分词后的结果进行搜索次数归并统计;
(33)根据(32)中的统计结果,对网页标题中的每个词进行匹配,得到标题中每个词在特定时间段的搜索次数,未匹配上的词次数记作0;
(34)对(33)中的统计结果进行渲染,并以直观的形式展示。
7.根据权利要求6所述的方法,其特征在于,所述“渲染”方法是通过网页技术(css、javascipt)或flash技术生成分析结果,分析结果的形式是以下形式的一种或几种:
●根据标题中每个词的搜索次数,次数多的词用深颜色文字,次数少的词用浅颜色文字
●根据标题中每个词的搜索次数,次数多的词用深颜色背景,次数少的词用浅颜色背景
●当鼠标停留在某个词上时,显示浮动框,框里显示该词的搜索次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于邢飞,未经邢飞许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110291388.1/1.html,转载请声明来源钻瓜专利网。