[发明专利]一种在社交网络中快速获取大量热门话题的方法有效
申请号: | 201310440419.4 | 申请日: | 2013-09-24 |
公开(公告)号: | CN103678474A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 王灿;王哲;金家禾;卜佳俊;陈纯;何占盈 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 社交 网络 快速 获取 大量 热门话题 方法 | ||
1.一种在社交网络中快速获取大量热门话题的方法,该方法的特征在于:
1)在社交网络中抓取用户发布的“状态”的转发记录,包括用户名、转发内容、转发时间、转发量,原作者和原“状态”发表时间;
2)通过聚类算法对所有“状态”内容进行聚类,每一个类定义为一个事件;
3)通过分析“状态”转发记录,针对目标用户,在其好友群中选取在最短时间内可以覆盖最多事件的K个好友;
4)将这K个好友放在特定的好友分组内,推荐给目标用户。
2.如权利要求1所述一种在社交网络中快速获取大量热门话题的方法,步骤2)中所述的通过聚类算法对所有“状态”内容进行聚类,每一个类定义为一个事件,其特征在于:
每一类“状态”定义为一个事件表示,获取到该事件中任何一条“状态”的信息就代表获得了该类话题的消息。
3.如权利要求1所述的一种在社交网络中快速获取大量热门话题的方法,步骤3)中所述通过分析“状态”转发记录,针对目标用户,在其“状态”好友群中选取在最短时间内可以覆盖最多事件的K个好友,其特征在于:
3.1假设用户转发了某一个事件中的任何一条“状态”,即代表该用户覆盖了这个事件;
3.2任意选取目标用户的K个好友组成集合A,定义t=T(i,A),表示集合A覆盖事件i的时间,即A中的所有用户覆盖事件i的所有时间中的最小值,若集合A没有覆盖事件i,则记T(i,A)=∞;
3.3定义 为惩罚函数,将时间t映射到一个实数,表示在t时刻覆盖该事件所带来的损失, 为事件i的重要系数,其中mi为事件i中所有“状态”的转发次数,sum(i)为所有“状态”的转发次数,我们假设事件的重要程度与转发比例成正比,因此损失与覆盖时间和重要系数的乘积成正比,此处惩罚函数fi(t)可以根据实际情况作其他更改,若T(i,A)=∞则fi(t)取函数最大值FMax(人为设定);
3.4遍历所有事件,定义整个网络的惩罚函数:
其中 表示事件i发生的概率,mi为事件i中所有“状态”的转发次数,total(i)为所有“状态”的个数;
3.5假设用户b的某种行为的产生受到用户a的直接或间接影响,且影响因子大于某一阈值,则认为a覆盖了b,例如用户b转发某条“状态”,除了受原作者和被转发者影响外,还可能受到其他用户的潜在影响,原作者和被转发者可能只会在这一事件上影响用户b,而用户a则可能在其他事件中起到更加关键的影响作用,我们将用概率模型表示这一过程;
3.6定义σ(A)表示集合A覆盖的用户个数,即集合A中所有用户分别覆盖不重复用户的总个数,σ(A)有多种计算方法,本发明采用线性阈值模型计算方法,定义:
该模型中 (tv>tw且v,w之间具有好友关系,否则值为0)表示在事件i中用户w对v的影响因子,tw、tv分别为w和v覆盖事件i的时间,a、θv为可调参数,I为指示性函数。
3.7定义目标函数:
其中F(A)为整个网络的惩罚函数,σ(A)表示集合A覆盖的用户个数,β为可调参数,通过求解上述目标函数得到在最短时间内可以覆盖最多事件的K个好友,K为人为设定,集合A中的用户具有以下特点:a)在目标函数的用户群中具有较大影响力,发布的消息转发率很高;b)在较短时间内,大量转发别人发布的重要消息;
3.8最小化目标函数G(A)是一个NP-hard问题,定义Ri(A)=fi(∞)=fi(T(i,A)),则
最小化G(A)等价于最大化H(A)=R(A)+βσ(A),可证明H(A)是一个次模函数,可通过贪婪算法求出近似解,而且近似比例大于1-1/e=0.63。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310440419.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:螺母及电子产品
- 下一篇:一种高压设备带电润滑装置