[发明专利]一种基于监测子网的微博热点事件实时检测方法及系统有效

专利信息
申请号: 201310017814.1 申请日: 2013-01-17
公开(公告)号: CN103116605A 公开(公告)日: 2013-05-22
发明(设计)人: 陈凯;周异 申请(专利权)人: 上海交通大学
主分类号: G06F17/30 分类号: G06F17/30;H04L12/26
代理公司: 上海汉声知识产权代理有限公司 31236 代理人: 郭国中
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 监测 子网 热点 事件 实时 检测 方法 系统
【说明书】:

技术领域

本发明涉及一种社交网络领域,具体地说,涉及的是一种在微博平台上进行热点事件实时检测的方法及系统。

背景技术

在Web2.0时代,社交网络日益成为人们网络生活的重要组成部分。微博作为一种通过关注机制分享简短信息的广播式的新型社交网络平台,它具有操作简单、互动性强等特点。随着2009年新浪微博的上线,腾讯、搜狐、网易国内四大微博网站以迅猛之势进入中文上网主流人群视野。中国互联网络信息中心(CNNIC)发布了《第28次中国互联网络发展状况统计报告》显示,2011年底微博用户数量增长迅猛,已经从6311万增长到1.95亿,微博月度覆盖人数已超博客等其它社交网络,成为社会化媒体中最重要的组成之一;月度浏览时长已超新闻资讯大类服务,成为主流信息资讯平台之一。由中国人民大学舆论研究所与百度合作完成的《中国社会舆情年度报告(2012)》蓝皮书集中呈现了2011年中国社会发展现状及热点问题。蓝皮书显示,在网民数量攀升与权利意识提高、热点话题层出不穷、“全民发声”、“围观结构”的互联网背景下,中国社会舆情呈现出复杂的变化趋势。2011全年具有社会影响力的网络热点事件总计349个,2010年为274个,2009年仅有248个,社会舆情指数不断攀升。舆情报告统计数据同样表明2011年发生的舆情事件中,微博是第一大信息源,从单纯的社交工具到舆论监督利器,微博已经完成了角色变换,正成为社会舆论热点的主要策源地,全面参与并影响着现实世界。

微博在热点事件的发生到推动整个过程中起到非常关键的作用,如果能在热点事件发生的初期就检测出来,将能够给相关部门或企业争取时间,对事件发展进行合理引导和及时采取相应的对策。因此为了避免热点事件由于处理不当或者反应过慢可能带来的巨大经济损失和不良的社会后果,对热点事件的及时准确的检测非常必要,具有重大的社会意义。

现有的热点事件检测一般采用分时间段采集所有微博,提取微博关键词构建特征向量,通过相似度比较统计所有话题相关的微博,然后根据参与话题的人数多少进行事件是否是热点的判断。目前大部分研究集中在如何对海量微博进行快速搜索,怎样提高微博内容语义识别以及话题相似度判断等。这些研究和方法可以在一定程度上提高热点事件检测系统的性能,但是由于微博以及热点事件的独特性,目前的热点事件检测方法和系统面临下面问题的挑战:

·微博数据量巨大,对处理速度要求极高:截止到2012年2月,Twitter用户已超5亿,活跃用户超一亿,每天新微博的发布数量达到2.5亿,相当于每分钟17.5万条;新浪微博用户突破3亿,每天活跃用户3000万左右,每天微博数接近一亿条;腾讯微博用户突破4亿,每天微博数量也是非常巨大。直接监测和处理微博网络上的所有微博,处理速度是瓶颈,代价非常大。

·微博内容短关键词少话题合并准确率低:通过少量微博关键词搜索话题和合并,会导致大量跟话题无关的噪声微博被合并。比如话题一般都由多个关键词组成,很多无关的微博却只是因为包含某个关键词也被加入到话题中,而且有很多垃圾微博推送者经常在微博中使用常用的关键词进行推广,干扰了热点事件的判断。

鉴于以上分析,传统的面向长信息的新闻类事件检测方法不太适合微博热点事件检测,同时随着微博用户和微博数量的爆炸式增长,对所有信息进行搜索和检测的方法需要非常大的经济和时间代价。

公开号为102194012A的中国发明专利提出一种基于传统新闻话题检测方法的微博话题检测方法,他们的方法主要是将传统的新闻话题检测方法应用到微博话题检测中。他们需要检测所有微博用户产生的巨量微博,不仅计算量巨大,系统费用非常高,而且因为微博内容信息较少以及大量噪声微博的影响,很难提取出较好的微博话题。本发明是通过样本学习获取少量重要的微博传播用户。监测这些少量用户产生的少量微博,不仅计算量非常小,而且噪声微博很少,可以以非常少的代价提取更准确的热点话题。

发明内容

本发明的目的在于针对目前微博数量巨大、微博热点话题检测干扰大、系统代价非常大的问题,提出一种基于微博监测子网的微博热点事件实时检测方法及系统。

根据本发明的一方面,本发明提供一种基于监测子网的微博热点事件实时检测方法,具体步骤包括如下:

步骤1:微博监测子网构建,根据用户影响力、用户参与事件的活跃度、用户参与事件的时间三个参数构建包含有限用户数量的微博监测子网;

步骤2:基于微博监测子网用户的微博数据实时采集,每隔一定时间收集微博监测子网中所有用户在该时间段内产生的新微博;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310017814.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top