[发明专利]一种基于主题的类引力模型微博预测方法与系统有效
申请号: | 201611184260.4 | 申请日: | 2016-12-20 |
公开(公告)号: | CN106777157B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 郭培伦;陈雁;文敏;李平;胡栋;文峤 | 申请(专利权)人: | 西南石油大学;四川数智汇通数据有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06Q50/00;G06F16/31;G06F16/951 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 袁英 |
地址: | 610500 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于主题的类引力模型微博预测方法与系统,所述的方法包括以下步骤:爬取相应的微博,并根据时间窗D的大小分别存储相应的微博转发关系及微博内容;对爬取的微博进行主题分类,重新按微博主题对爬取的微博转发关系进行存储,针对每个微博主题建立微博转发关系网络,根据每个微博主题转发库中的转发关系,计算每条边的权重并利用统计方法计算边的权重。所述的系统包括数据爬取模块、微博库、转发关系库、分析模块、预测关系库、用户前端模块和用户后端模块,本发明提高了局部预测的精度,同时通过带有权重的类引力模型可以任意预测第K批关注者的转发情况,基于不同的主题转发关系,提高了预测准确度。 | ||
搜索关键词: | 一种 基于 主题 引力 模型 预测 方法 系统 | ||
【主权项】:
一种基于主题的类引力模型微博预测方法,其特征在于,它包括以下步骤:S1:爬取微博,并根据时间窗D的大小分别存储相应的微博转发关系及微博内容;S2:利用现有的主题模型对爬取的微博内容进行主题分类;S3:根据不同的主题分类分别存储微博转发关系;S4:基于不同主题分类的转发关系,建立有向图网络;S5:统计有向图网络中的节点个数M,并给予每个节点1/M的权重;S6:统计每个微博用户发布的微博被转发的总数N,以及每个微博用户对应的各个粉丝转发的数量n1,n2,n3…ni,计算每个粉丝对应的每条有向边的初始权重为:S7:把选定节点的权重根据有向边的权重分配到关注该节点的节点上,用以更新关注该节点的每个节点的权重;S8:根据更新以后的节点权重计算相应的有向边的权重;S9:循坏执行S7~S8步骤,直到每个节点的权重收敛;S10:根据需要获取待测微博的第K度粉丝的节点权重k1,k2,…kn;S11:计算待测微博到选定的一个K度粉丝的引力指数:其中,M为待测微博用户的节点权重,m为选定的一个K度粉丝的节点权重,r为M到m的一条路线的所有有向边的权重之和的倒数,G根据实际需要设定。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南石油大学;四川数智汇通数据有限公司,未经西南石油大学;四川数智汇通数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611184260.4/,转载请声明来源钻瓜专利网。