[发明专利]在社交网络中基于泊松过程模型的事件流行度预测方法有效
申请号: | 201410334425.6 | 申请日: | 2014-07-14 |
公开(公告)号: | CN104182457B | 公开(公告)日: | 2017-08-01 |
发明(设计)人: | 陈凯;周异;何建华;周曲;杨蒙蒙 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q10/04;G06Q50/00 |
代理公司: | 上海汉声知识产权代理有限公司31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 网络 基于 过程 模型 事件 流行 预测 方法 | ||
1.一种在社交网络中基于泊松过程模型的事件流行度预测方法,其特征在于包括如下步骤:
第一步,选取样本事件,并获取样本事件的传播链;
第二步,用户影响力计算,并筛选影响力大的用户作为关键用户,并将剩下的用户标记为非关键用户;
第三步,将关键用户带来的转发传播过程建模为泊松过程模型,而对非关键用户带来的转发传播过程,仅仅使用样本数据获得一个经验比例值;
第四步,使用样本事件的信息来学习和估计关键用户的泊松过程模型的参数以及非关键用户的参数,以确定第三步中的模型;
第五步,给定一个已知时间长度的演化信息的新的事件,根据第三步中的模型来预测它在未来某时刻的流行度。
2.根据权利要求1所述的在社交网络中基于泊松过程模型的事件流行度预测方法,其特征在于:上述第一步中,选取样本事件是指:对发生在某一个社交网络平台中的热点事件进行选择,这里的热点事件是指被该社交网络平台或其他热门排行榜列为热点话题;这里的事件通过事件内容的一组关键词来描述,本身是一组内容相近的用户产生内容(UGC)的集合;选取的事件需要反映这个社交网络平台在一定时间段内的所有热点事件信息。
3.根据权利要求2所述的在社交网络中基于泊松过程模型的事件流行度预测方法,其特征在于:所述选取样本事件是按照下面的步骤选取的:
(1)周期性的分别从各大热门话题榜各获取前10个热门事件的标题;
(2)用新闻搜索引擎搜索热门事件的标题,获取有关事件更多的文本信息和关键词;
(3)在社交网络的搜索页面中搜索每个事件的关键词,解析出和该事件有关的原创热门UGC;
(4)使用社交网络开放平台提供的API来获取每个事件中的原创UGC的转发链,包括每条UGC的创建时间、文本、作者信息;
(5)检测有规律的发布UGC,发布UGC时间间隔短,重复多次转发同一个社交网络用户的水军账户,删除它们发出的所有UGC。
4.根据权利要求1-3任一项所述的在社交网络中基于泊松过程模型的事件流行度预测方法,其特征在于:所述第一步中,获取样本事件的传播链中的传播链是指参与事件传播的社交网络用户的用户产生内容(UGC)之间具有转发关系,这些UGC转发关系构成有向的具有时间性的传播关系链叫UGC传播链;获取传播链是指通过社交网络平台提供的API获取参与事件传播的用户人数大于阈值T2的UGC传播链,T2是任意正整数,T2为0表示获取事件相关的所有传播链,参与人数少的UGC传播链将被舍去。
5.根据权利要求1所述的在社交网络中基于泊松过程模型的事件流行度预测方法,其特征在于:所述第二步中,用户的影响力是指该用户在事件传播过程中吸引其他用户参与事件传播的能力,用户影响力跟他的粉丝数、粉丝质量、用户之间的交互、发布用户产生内容(UGC)的转发数,甚至和参与事件的主题有关。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410334425.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:云平台数据访问安全隔离方法
- 下一篇:一种文件自动清理的方法及装置