[发明专利]一种基于主题的类引力模型微博预测方法与系统有效

专利信息
申请号: 201611184260.4 申请日: 2016-12-20
公开(公告)号: CN106777157B 公开(公告)日: 2023-04-07
发明(设计)人: 郭培伦;陈雁;文敏;李平;胡栋;文峤 申请(专利权)人: 西南石油大学;四川数智汇通数据有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06Q50/00;G06F16/31;G06F16/951
代理公司: 成都金英专利代理事务所(普通合伙) 51218 代理人: 袁英
地址: 610500 四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 主题 引力 模型 预测 方法 系统
【权利要求书】:

1.一种基于主题的类引力模型微博预测方法,其特征在于,它包括以下步骤:

S1:爬取微博,并根据时间窗D的大小分别存储相应的微博转发关系及微博内容;

S2:利用现有的主题模型对爬取的微博内容进行主题分类;

S3:根据不同的主题分类分别存储微博转发关系;

S4:基于不同主题分类的转发关系,建立有向图网络;

S5:统计有向图网络中的节点个数M,并给予每个节点1/M的权重

S6:统计每个微博用户发布的微博被转发的总数N,以及每个微博用户对应的各个粉丝转发的数量n_1,n_2,n_3...n_i,i为粉丝数量,计算每个粉丝对应的每条有向边的初始权重为:

n_i/(N*1/M)

S7:把选定节点的权重根据有向边的权重分配到关注该节点的节点上,用以更新关注该节点的每个节点的权重;

S8:根据更新以后的节点权重计算相应的有向边的权重;

S9:循坏执行S7~S8步骤,直到每个节点的权重收敛;

S10:根据需要获取待测微博的第K度粉丝的节点权重k,k_2,k_3...k_i,k度粉丝为第k批关注

转发微博的用户,第k批用户通过关注第k-1批用户关注到该转发微博;

S11:计算待测微博到选定的一个K度粉丝的引力指数:

F=G Mm/r^2

其中,M为待测微博用户的节点权重,m为选定的一个K度粉丝的节点权重,r为M到m的所有有向边的权重之和的倒数,G为常数。

2.根据权利要求1所述的一种基于主题的类引力模型微博预测方法,其特征在于:所述步骤S1中的有向边是指在同一主题分类下由被关注者指向关注者的单向边。

3.根据权利要求1所述的一种基于主题的类引力模型微博预测方法,其特征在于:所述步骤S2中的网络节点为涉及到转发微博的同一主题分类下的关注者,所述的节点个数M为涉及到转发微博的同一主题下的关注者个数。

4.根据权利要求1所述的一种基于主题的类引力模型微博预测方法,其特征在于:所述的K度粉丝为第K批关注转发微博的用户,第K批用户通过关注第K-1批用户关注到该转发微博。

5.根据权利要求1所述的一种基于主题的类引力模型微博预测方法,其特征在于:所述S5中,根据关注者转发的微博数占被关注者发布的被转发的微博总数的比例进行分配权重。

6.根据权利要求1所述的一种基于主题的类引力模型微博预测方法,其特征在于:所述步骤S7中通过设定一个阈值,判断每个节点的变化率是否小于该阈值,若是,则停止迭代。

7.根据权利要求1所述的一种基于主题的类引力模型微博预测方法,其特征在于:所述的G从一个设定值开始,通过测验预测效果直到找到最佳预测效果下的G值,然后以最佳预测效果下的G值作为选定的特定主题下的G值。

8.一种基于主题的类引力模型微博预测系统,基于权利要求1至7任一项所述的一种基于主题的类引力模型微博预测方法实现,其特征在于:它包括数据爬取模块、微博库、转发关系库、分析模块、预测关系库、用户前端模块和用户后端模块,所述数据爬取模块用于对微博的爬取;所述微博库用于存储爬取的微博内容;所述转发关系库用于存储数据爬取模块爬取的微博转发关系:所述分析模块用于对爬取的微博内容进行主题分类,对转发关系库中的转发关系进行统计分析,建立相应的图网络,并计算网络节点中的权重及边的权重;所述预测关系库用于保存分析模块生成的不同主题微博的转发预测信息;所述用户前端模块为用户提供界面方便其录入待测微博用户信息:所述用户后端模块调用分析模块的函数进行分析,根据用户输入的信息得到预测结果,预测结果存储后提供给特定网站进行调用。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南石油大学;四川数智汇通数据有限公司,未经西南石油大学;四川数智汇通数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611184260.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top