[发明专利]在社交网络中基于泊松过程模型的事件流行度预测方法有效
申请号: | 201410334425.6 | 申请日: | 2014-07-14 |
公开(公告)号: | CN104182457B | 公开(公告)日: | 2017-08-01 |
发明(设计)人: | 陈凯;周异;何建华;周曲;杨蒙蒙 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q10/04;G06Q50/00 |
代理公司: | 上海汉声知识产权代理有限公司31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 网络 基于 过程 模型 事件 流行 预测 方法 | ||
技术领域
本发明涉及互联网技术领域内社交网络中的事件流行度预测方法,具体地说,涉及的是一种在社交网络中基于泊松过程模型的事件流行度预测方法。
背景技术
在Web2.0时代,社交网络发展如火如荼,逐渐成为网民日常生活中的重要部分。微博作为一种通过关注机制分享简短信息的广播式的新型社交网络平台,它具有操作简单、互动性强等特点。到2012年年底,新浪微博注册用户数已经超过了4亿,微博作为一种新兴媒体,它在传播信息、形成热点话题和热点事件中起到了越来越重要的作用。微博正成为社会舆论热点的主要策源地,全面参与并影响着现实世界。
微博在热点事件的发生到推重整个过程中起到非常关键的作用,如果能在事件发生的初期就对其未来的流行度有较准确的预测,将能够给相关部门或企业争取时间,对事件发展进行合理引导和及时采取相应的对策。因此为了避免热点事件由于处理不当或者处理不及时可能带来的经济损失和不良社会后果,对事件的流行度进行预测非常必要,具有重大社会意义。
经检索,目前没有与事件流行度的预测相关的公开专利。
发明内容
本发明要解决的问题是提供一种在社交网络中对事件的流行度进行预测的方法,并基于此,对事件的流行度进行预测,从而可以早的对事件的发展态势了解,给相关部门或企业争取尽可能多的时间制定对策。
本发明一个目的是提供一种社交网络中事件流行度的预测方法,具体包括:
第一步,选取样本事件,并获取样本事件的微博传播链;
第二步,用户影响力计算,并筛选影响力大的作为关键用户,并将剩下的用户标记为非关键用户;
第三步,将关键用户带来的转发微博过程建模为泊松过程模型,而对非关键用户带来的转发微博过程简单处理;
第四步,使用样本事件的信息来学习和估计关键用户的泊松过程模型的参数以及非关键用户的参数;
第五步,给定一个已知一定时间长度的演化信息的新的事件,根据第三步中的模型来预测它在未来某时刻的流行度。
所述第一步中,选取样本事件是指:对发生在某一个社交网络平台中的热点事件进行选择,这里的热点事件是指被该社交网络平台或其他热门排行榜列为热点话题;这里的事件通过事件内容的一组关键词来描述,本身是一组内容相近的用户产生内容(UGC)的集合;选取的事件需要反映这个社交网络平台在一定时间段内的所有热点事件信息。
优选地,所述选取样本事件是按照下面的步骤选取的:
(1)周期性的分别从各大热门话题榜各获取前10个热门事件的标题;
(2)用新闻搜索引擎搜索热门事件的标题,获取有关事件更多的文本信息和关键词;
(3)在社交网络的搜索页面中搜索每个事件的关键词,解析出和该事件有关的原创热门UGC;
(4)使用社交网络开放平台提供的API来获取每个事件中的原创UGC的转发链,包括每条UGC的创建时间、文本、作者信息;
(5)检测有规律的发布UGC,发布UGC时间间隔短,重复多次转发同一个社交网络用户的水军账户,删除它们发出的所有UGC。
优选地,所述第一步中,获取样本事件的传播链中的传播链是指参与事件传播的社交网络用户的用户产生内容(UGC)之间具有转发关系,这些UGC转发关系构成有向的具有时间性的传播关系链叫UGC传播链;获取传播链是指通过社交网络平台提供的API获取参与事件传播的用户人数大于阈值T2的UGC传播链,T2是任意正整数,T2为0表示获取事件相关的所有传播链,参与人数少的UGC传播链将被舍去。
优选地,所述第二步中,用户的影响力是指该用户在事件传播过程中吸引其他用户参与事件传播的能力,用户影响力跟他的粉丝数、粉丝质量、用户之间的交互、发布用户产生内容(UGC)的转发数,甚至和参与事件的主题有关。所述用户的影响力采用基于PageRank的方法计算;或者用户ui的影响力si采用以下方法获得:
(1)计算每个用户在样本事件数据中的发出的UGC数
(2)计算每个用户在样本事件数据中由其一级转发用户产生的UGC转发数
(3)用来代表这样一个用户集合,在这个集合中的每个用户uj发出的UGC的转发数之和都为并且uj至少转发了ui一次,那么用户ui的影响力用下面的式子计算:
其中|U|代表用户集合U中的用户数。
更好地,所述关键用户的筛选过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410334425.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:云平台数据访问安全隔离方法
- 下一篇:一种文件自动清理的方法及装置