[发明专利]一种基于主题的微博转发预测方法与系统在审
申请号: | 201611185198.0 | 申请日: | 2016-12-20 |
公开(公告)号: | CN106600071A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 郭培伦;陈雁;杨晶宇;李平;胡栋;葛忆 | 申请(专利权)人: | 西南石油大学;四川数智汇通数据有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00 |
代理公司: | 成都金英专利代理事务所(普通合伙)51218 | 代理人: | 袁英 |
地址: | 610500 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主题 转发 预测 方法 系统 | ||
1.一种基于主题的微博转发预测方法,其特征在于,它包括以下步骤:
S1:爬取相应的微博,并根据时间窗D的大小分别存储相应的微博转发关系及微博内容;
S2:基于现有的主题模型对爬取的微博内容进行主题分类;
S3:根据不同的主题分类分别存储相应的微博转发关系;
S4:根据不同主题的转发关系,建立有向图网络;
S5:统计每个微博用户发布的微博被转发的总数N,以及对应的各个关注者转发的数量n1,n2,n3…ni,计算对应的每条有向边的初始权重为
S6:统计有向网络中节点个数M,并给予每个节点1/M的权重;
S7:更新每个节点的权重,以首先发布微博的用户为节点,把当前节点的权重根据有向边的权重分配到直接该微博的节点上;
S8:完成发布微博的用户和第一批关注者的节点权重更新以后,依次更新剩下的各批关注者的节点的权重;
S9:重复S8步骤,直到每个节点的权重收敛;
S10:获取待测微博的第一批关注者的权重w1,w2,…wn;
S11:根据需要设定一个权重阈值Q1,循环判断所述第一批关注者的权重w1,w2,…wn是否超过阈值Q1,如果超过,则保留;如果没有超过,则去除;如果都不超过,则去掉topK个权重值后作为下一个阶段的传播预测;
S12:重复S11,根据需要设定一个关注者个数阈值Q2,直到关注者的权重都小于Q1且注者的个数都小于Q2时,停止预测。
2.根据权利要求1所述的一种基于主题的微博转发预测方法,其特征在于:所述的步骤S4中,不同的主题转发关系下分别建立对应主题的转发关系有向图网络。
3.根据权利要求1所述的一种基于主题的微博转发预测方法,其特征在于:所述步骤S6中的网络节点个数M为涉及到转发微博的关注者个数。
4.根据权利要求1所述的一种基于主题的微博转发预测方法,其特征在于:所述的步骤S7中,根据关注者转发的微博数占被关注者发布的被转发的微博总数的比例进行分配权重。
5.根据权利要求1所述的一种基于主题的微博转发预测方法,其特征在于:所述的步骤S9中,能够根据实际需求设置迭代次数直到满足实际情况需要或者通过设定一个节点变化率阈值Q3,如果每个节点的变化率都小于Q3,则停止迭代,进行该阶段的预测。
6.根据权利要求1所述的一种基于主题的微博转发预测方法,其特征在于:所述的第一批关注者为直接关注首先发布微博的用户的关注者,第二批关注者为通过关注第一批关注者关注到了该转发微博,第三批关注者为通过关注第二批关注者关注到了该转发微博,依次类推,第K批关注者为通过第K-1批关注者关注到了该转发微博。
7.根据权利要求1所述的一种基于主题的微博转发预测方法,其特征在于:所述的步骤S9能够根据实际需求设置迭代次数,直到满足实际情况需要或者直到每个节点的权重收敛,然后停止迭代,进行该阶段的预测。
8.根据权利要求1所述的一种基于主题的微博转发预测方法,其特征在于:所述的步骤S10中,第一批关注者的权重为均分权重1/M。
9.根据权利要求8所述的一种基于主题的微博转发预测方法,其特征在于:所述的预测在每一次预测中涉及关注者和被关注者两个级层,每一个级层预测一次。
10.一种基于主题的微博转发预测系统,其特征在于:它包括数据爬取模块、微博库、转发关系库、分析模块、预测关系库、用户前端模块和用户后端模块,所述数据爬取模块用于对微博的爬取;所述微博库用于存储爬取的微博内容;所述转发关系库,用于存储数据爬取模块爬取的微博转发关系;所述分析模块主要用于对爬取的微博内容进行主题分类,对转发关系库中的转发关系进行统计分析,建立相应的有向图网络,进而计算每条边的权重;所述预测关系库保存分析模块生成的不同主题微博的转发预测信息;所述用户前端模块为用户提供界面方便其录入待测微博用户信息;所述用户后端模块用于调用分析模块的函数进行分析,根据用户输入的信息得到预测结果,预测结果存储后提供给特定网站进行调用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南石油大学;四川数智汇通数据有限公司,未经西南石油大学;四川数智汇通数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611185198.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理