[发明专利]一种网络词热度确定方法和装置有效

专利信息
申请号: 201110247837.2 申请日: 2011-08-25
公开(公告)号: CN102955804A 公开(公告)日: 2013-03-06
发明(设计)人: 田冬;张远;吴淑燕 申请(专利权)人: 中国移动通信集团公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京德琦知识产权代理有限公司 11018 代理人: 谢安昆;宋志强
地址: 100032 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 网络 热度 确定 方法 装置
【说明书】:

技术领域

发明涉及互联网技术,特别涉及一种网络词热度确定方法和装置。

背景技术

网络词热度确定,对有关部门的调研、决策、管理和服务有着重要的参考价值。现有确定方式主要为:查询搜索引擎的接口,根据网络词的搜索次数和搜索结果量,按照某种方式计算出一个表征网络词热度的参数,搜索次数和搜索结果量均与网络词热度成正比。

但是,这种方式需要依赖于用户在使用搜索引擎时的输入行为,因此有一定的主观性和片面性,不够准确;而且,搜索结果量仅能体现出网络词的出现频率,无法体现出分布情况等信息,也会导致确定结果不准确,比如,如果一网络词只是在某一或某几个页面中出现的频率很高,而在其它页面中很少出现甚至不出现,那么按照现有方式确定出的该网络词的热度也会较高。

发明内容

有鉴于此,本发明提供了一种网络词热度确定方法和装置,能够提高网络词热度确定结果的准确性。

为达到上述目的,本发明的技术方案是这样实现的:

一种网络词热度确定方法,包括:

接收用户输入的网络词X,获取包括所述网络词X的页面的页面地址和发布时间;

根据获取到的页面地址计算所述网络词X的地域分布参数,根据获取到的发布时间计算所述网络词X的时间分布参数,根据所述地域分布参数和所述时间分布参数计算所述网络词X的热度值,展示给用户。

一种网络词热度确定装置,包括:

应用程序接口API,用于接收用户通过用户界面输入的网络词X,获取包括所述网络词X的页面的页面地址和发布时间;

热度计算模块,用于根据获取到的页面地址计算所述网络词X的地域分布参数,根据获取到的发布时间计算所述网络词X的时间分布参数,根据所述地域分布参数和所述时间分布参数计算所述网络词X的热度值,通过用户界面展示给用户。

可见,采用本发明所述方案,在确定网络词热度时,无需依赖于用户在使用搜索引擎时的输入行为,而且,充分考虑了网络词的地域分布情况和时间分布情况,从而使得确定结果更为客观和全面,进而提高了确定结果的准确性。

附图说明

图1为本发明方法实施例的流程图。

图2为本发明装置实施例的组成结构示意图。

具体实施方式

针对现有技术中存在的问题,本发明中提出一种改进后的网络词热度确定方案,能够提高确定结果的准确性。

为使本发明的技术方案更加清楚、明白,以下参照附图并举实施例,对本发明所述方案作进一步地详细说明。

图1为本发明方法实施例的流程图。如图1所示,包括以下步骤:

步骤11:接收用户输入的网络词X(用网络词X来代表用户输入的任一网络词),获取包括网络词X的页面的页面地址和发布时间。

所述页面地址即指页面的统一资源定位符(URL,Uniform Resource Locator)。

本发明中,需要建立一个词库和一个网页正文索引库,其中,词库中保存有一系列的网络词,初始阶段,词库中的网络词可由人工输入,网页正文索引库中保存有按照某种方式从各网站中抓取到的各页面的正文内容,以及每篇正文内容的页面地址和发布时间。如何进行抓取为现有技术,另外,对哪些网站进行抓取以及对网站中的哪些页面进行抓取均可根据实际需要而定。

之后,利用词库中保存的网络词对每篇正文内容进行分词,即如果词库中保存的某一网络词出现在了某一篇正文内容中,则用特殊符号将该网络词在该正文内容中标识出来,如何进行标识不作限制,只要能够识别即可,并用分词后的正文内容对应替换掉分词前的正文内容。

词库和网页正文索引库中保存的内容均可实时更新,比如,在对正文内容进行分词后,选取单个字组成的序列,如果某一序列的出现频率大于预设阈值,则将该序列作为新的网络词,补充到词库中。

另外,词库中可同时保存有每个网络词被加入到词库中的时间,具体作用后续将会介绍。

当接收到用户输入的网络词X后,从网页正文索引库中查询出包括网络词X的页面的页面地址和发布时间。

步骤12:根据获取到的页面地址计算网络词X的地域分布参数,根据获取到的发布时间计算网络词X的时间分布参数,根据地域分布参数和时间分布参数计算网络词X的热度值,展示给用户。

本发明中在计算网络词X的热度值时,主要考虑两个因素,即网络词X的地域分布情况和时间分布情况,相应地,可计算出网络词X的地域分布参数和时间分布参数,并结合它们对热度值的贡献权重,最终计算出热度值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团公司,未经中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110247837.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top