[发明专利]一种基于监测子网的微博热点事件实时检测方法及系统有效
申请号: | 201310017814.1 | 申请日: | 2013-01-17 |
公开(公告)号: | CN103116605A | 公开(公告)日: | 2013-05-22 |
发明(设计)人: | 陈凯;周异 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L12/26 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于监测子网的微博热点事件实时检测方法及系统。该方法包括:1)微博监测子网构建,基于用户活跃度、影响力和响应时间构建含有少量关键用户的微博监测子网;2)微博数据实时收集,每隔一定时间周期实时收集微博监测子网所有用户发布的新微博;3)对收集的新微博进行分词和话题合并;4)构建、查询和更新话题列表;5)基于一定时间窗口,根据话题列表内的参与某话题的人数变化进行热点事件判决。本发明利用少量关键用户在热点事件传播中的重要作用,构建微博监测子网,不仅极大地降低了需要处理的微博数据量,降低系统成本,而且可以去除大量噪声微博,提高话题合并的准确率,可以利用单台服务器实现实时快速热点事件检测。 | ||
搜索关键词: | 一种 基于 监测 子网 热点 事件 实时 检测 方法 系统 | ||
【主权项】:
一种基于监测子网的微博热点事件实时检测方法,其特征在于包括以下步骤:步骤1:微博监测子网构建,根据用户影响力、用户参与事件的活跃度、用户参与事件的时间三个参数构建包含有限用户数量的微博监测子网;步骤2:基于微博监测子网用户的微博数据实时采集,每隔一定时间收集微博监测子网中所有用户在该时间段内产生的新微博;步骤3:微博内容分词与话题合并,对收集到的新微博进行分词,为每条微博基于分词词汇构建特征向量,构建微博然后进行话题合并;步骤4:话题列表的构建、更新与查询,对话题列表进行构建、更新与查询;步骤5:热点事件判决,基于时间窗口对话题列表内的话题,统计参与话题的用户数量变化进行热点事件判决;步骤6:输出热点事件列表。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310017814.1/,转载请声明来源钻瓜专利网。
- 上一篇:抗菌乳胶漆
- 下一篇:一种斗提式搅拌站断绳保护装置