[发明专利]一种基于主题的类引力模型微博预测方法与系统有效
申请号: | 201611184260.4 | 申请日: | 2016-12-20 |
公开(公告)号: | CN106777157B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 郭培伦;陈雁;文敏;李平;胡栋;文峤 | 申请(专利权)人: | 西南石油大学;四川数智汇通数据有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06Q50/00;G06F16/31;G06F16/951 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 袁英 |
地址: | 610500 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主题 引力 模型 预测 方法 系统 | ||
本发明公开了一种基于主题的类引力模型微博预测方法与系统,所述的方法包括以下步骤:爬取相应的微博,并根据时间窗D的大小分别存储相应的微博转发关系及微博内容;对爬取的微博进行主题分类,重新按微博主题对爬取的微博转发关系进行存储,针对每个微博主题建立微博转发关系网络,根据每个微博主题转发库中的转发关系,计算每条边的权重并利用统计方法计算边的权重。所述的系统包括数据爬取模块、微博库、转发关系库、分析模块、预测关系库、用户前端模块和用户后端模块,本发明提高了局部预测的精度,同时通过带有权重的类引力模型可以任意预测第K批关注者的转发情况,基于不同的主题转发关系,提高了预测准确度。
技术领域
本发明涉及微博预测领域,具体是一种基于主题的类引力模型微博预测方法与系统。
背景技术
微博是一种基于用户关系的实时信息交流、分享、传播的社交平台,与Facebook、Twitter等社交网络一样影响了人类的生活交流方式。在微博平台上,随着用户数量以亿万级为单位数量的增加,大量的图片、文本等海量信息的背后反映的是人们的生活想法、知识和有趣的事情。微博的出现除了产生有益影响,也带来了很多问题,例如不良言论的无约束传播等严重破坏了社会生活风气。所以,对微博用户的活动状态进行预测,对于政府、企事业单位、个人都有重要的意义。
在现有的微博预测解决方案中,公开号为CN104933622A的中国专利公开了一种基于用户和微博主题的微博流行度预测方法及系统,该方法包括:获取预设时间段内的微博数据和用户数据,根据所述微博数据和所述用户数据,获取用户属性特征和微博主题特征,将所述用户属性特征进行归一化处理,以处理后的所述用户特征进行用户聚类,并根据聚类结果,获取用户的类别信息;根据所述微博主题特征和所述用户的类别信息,获取用户聚类在所述微博主题下的转发特征,并计算所述用户聚类在所述微博主题下的权重系数;根据所述微博主题特征、所述用户属性特征、所述权重系数,构建微博流行度预测模型,通过所述微博流行度预测模型对微博流行度进行预测。该专利利用不同时间间隔的影响权重进行流行度预测模型的构建与本发明基于主题转发关系的有向图网络进行节点权重刻画不同的转发概率的方案不同,且本发明在不同的主题转发关系下不仅实现对任意第K批关注者的预测,而且提高了预测的准确度。
对于多种级层关系的微博转发关系网络,在不同主题类型的转发关系中,多种级层关系的预测的准确性并不高,不能实现对任意第K批关注者的转发情况预测。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于主题的类引力模型微博预测方法与系统,以至少实现对任意K度粉丝进行转发预测、提高准确性和预测精度的效果。
本发明的目的是通过以下技术方案来实现的:一种基于主题的类引力模型微博预测方法,它包括以下步骤:
S1:爬取微博,并根据时间窗D的大小分别存储相应的微博转发关系及微博内容;
S2:利用现有的主题模型对爬取的微博内容进行主题分类;
S3:根据不同的主题分类分别存储微博转发关系;
S4:基于不同主题分类的转发关系,建立有向图网络;
S5:统计有向图网络中的节点个数M,并给予每个节点1/M的权重;
S6:统计每个微博用户发布的微博被转发的总数N,以及每个微博用户对应的各个粉丝转发的数量n1,n2,n3…ni,计算每个粉丝对应的每条有向边的初始权重为:
S7:把选定节点的权重根据有向边的权重分配到关注该节点的节点上,用以更新关注该节点的每个节点的权重;
S8:根据更新以后的节点权重计算相应的有向边的权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南石油大学;四川数智汇通数据有限公司,未经西南石油大学;四川数智汇通数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611184260.4/2.html,转载请声明来源钻瓜专利网。