[发明专利]一种博客信息传播中识别关键博客集的方法有效

专利信息
申请号: 201110239145.3 申请日: 2011-08-19
公开(公告)号: CN102262681A 公开(公告)日: 2011-11-30
发明(设计)人: 顾庆;张尧;汤九斌;陈道蓄 申请(专利权)人: 南京大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 江苏圣典律师事务所 32237 代理人: 贺翔
地址: 210093*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 博客 信息 传播 识别 关键 方法
【权利要求书】:

1.一种博客信息传播中识别关键博客集的方法,其特征在于包含以下步骤:

1)以博客为单位收集和确定博主间的关联;

2)以博客为节点构建博客网络图,图的边为博客间的关联,对应博客间的链接关系或者博主之间的关注关系;

3)根据信息传播模型确定博客网络图中博客间的关联的权重;

4)基于博客网络图和关联权重的设置计算每个博客对其他博客信息传播影响力的期望值;

5)根据博客间信息传播影响力的期望值,识别博客网络图中信息传播影响力最大的关键节点集合,即关键博客集。

2.根据权利要求1所述的博客信息传播中识别关键博客集的方法,其特征在于步骤1)中的关联包括关注关系以及博客中文章间的链接关系;而收集和确定博客间的关联过程为:首先从博客网站获取博客数据,为每一个博客,即博主,赋予唯一标识,如Bi;然后获取博主的好友列表或关注列表;好友列表确定博主间双向的好友关系;关注列表确定博主间单向的关注关系;好友关系可以表示为两个互为反向的关注关系;如果博主Bi关注博主Bj,则两者间的关注关系标记为<Bj,Bi,f>;接下来获取博客Bi在t日内粘贴的文章,对博客Bi中的每一篇文章批Pix,如果Pix链接了博客Bj中的文章Pjy,则认为博客Bi与博客Bj之间存在链接关系,标记为<Bj,Bi,Δt>,其中Δt表示文章Pix粘贴日期与当前日期的差值;如果博客Bi多次引用博客Bj中文章,则Δt为其中的最小值。

3.根据权利要求2所述的的博客信息传播中识别关键博客集的方法,其特征在于步骤2)中构建博客网络图的流程是:首先定义博客网络图 为有向图,其中 为博客集合,每个博客作为图中节点;E为博客之间关联的集合,即图中有向边的集合;然后对博客群 中任意两个博客Bi和Bj,如果Bi和Bj间存在关注关系<Bj,Bi,f>,或者存在链接关系<Bj,Bi,Δt>,则在Bi和Bj之间定义有向边eji:Bj→Bi;同理如果是<Bi,Bj,f>或者<Bi,Bj,Δt>,则定义有向边eij:Bi→Bj

4.根据权利要求3所述的的博客信息传播中识别关键博客集的方法,其特征在于步骤3)中所述确定博客网络图中博客间的关联的权重,即确定博客网络图中有向边的权重,其分三种情况:对边集E中的每一条有向边eij,分析eij对应的关联关系;其中:

情况1,关联关系为链接关系:<Bi,Bj,Δt>,此时采用独立级联模型为边赋权重,即wij=λe-α·Δt,其中链接关系权重的初始值λ设为0.1,指数参数α设为0.5;

情况2,关联关系为关注关系:<Bi,Bj,f>,此时采用加权级联模型为边赋权重, 即 其中集合Fj是博主Bj的关注集,|Fj|指集合的规模;关注关系权重的最大值δ设为0.6;

情况3,关联关系同时为链接关系和关注关系,此时选择两者所确定权重的最大值作为该边上的权重,即

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110239145.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top