[发明专利]一种微博话题热度预测系统及方法有效
申请号: | 201410368076.X | 申请日: | 2014-07-30 |
公开(公告)号: | CN104123377B | 公开(公告)日: | 2017-06-06 |
发明(设计)人: | 陈羽中;郭文忠;陈国龙;方明月 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 福州元创专利商标代理有限公司35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 话题 热度 预测 系统 方法 | ||
技术领域
本发明涉及社交网络技术领域,特殊涉及一种微博话题热度预测系统及方法。
背景技术
微博已成为互联网的一种时尚,随着微博的快速发展,微博信息呈现一种爆炸式的增长态势,大量的微博信息导致微博平台成为当今社会重要的舆论场。如何从海量微博信息中了解并预测出用户所关注话题的热度趋势成为一个具有挑战性的研究课题。
近年来,基于社交媒体的总统选举预测、票房预测、话题热度预测等预测问题的研究引起了学者们的关注。其中话题热度预测旨在挖掘话题被关注的情况及变化趋势,而如何量化话题的热度是话题热度预测的重要前提。高热度话题是指在一段时间内频繁出现在网络上,并被用户广泛关注并讨论的话题。因此,话题相关微博数及其相关用户共同决定着话题的热度。然而,现有的微博话题热度预测方法大都只考虑微博信息而忽略了用户社会关系,如很多方法只考虑当前时间片的微博数作为新闻热度,忽略了不同用户对于话题知名度的贡献的区别。已有部分方法将用户关系考虑在内,但忽略用户同预测话题之间的相关性。此外,话题的热度不仅受当前时间片产生的微博和相关用户影响,也受到话题的历史热度值的影响。因此有研究人员引进老化理论计算话题的能量值,刻画话题生命周期。
从统计的思想出发,话题热度的预测可以看成是在已有的历史时间序列数值情况下,对未来某个时刻的话题的能量值的预测。现有时间序列值的预测大多基于回归预测模型,如自回归或者自回归滑动预测模型(ARMA)、基于神经网络的预测模型等。采用基于回归的预测模型适用于值在时间上的波动较为平稳的情况。而话题在演化过程中具有突发性,表现出明显的多尺度特性。而基于神经网络的预测模型能够较好地预测非线性的时间序列,但模型训练和计算的复杂度过高。
综上,现有的话题热度预测系统及方法尚有很大的提升空间。面对海量微博话题数据,现有方法无论是在效果和效率上都难以满足要求。
发明内容
本发明的目的在于克服现有技术的不足,提供一种微博话题热度预测系统及方法,该系统及方法可有效预测话题热度。
为实现上述目的,本发明的技术方案是:一种微博话题热度预测系统,所述系统包括:
用户影响力计算模块,用于计算话题相关的用户影响力;
话题能量值计算模块,用于根据与话题相关的微博和用户影响力计算话题能量值,量化话题热度;
话题热度预测模块,用于根据计算得到的话题能量值,利用小波变换和ARIMA回归模型,预测话题热度。
本发明还提供一种微博话题热度预测方法,所述方法包括如下步骤:
步骤A:计算话题相关的用户影响力;
步骤B:根据话题相关的微博和用户影响力,计算话题能量值,量化话题热度;
步骤C:根据计算得到的话题能量值,利用小波变换和ARIMA回归模型,预测话题热度:对能量曲线进行小波分解,然后分别对得到的逼近信号与各层的细节信号进行ARIMA回归预测,再对预测的分量进行重构,得到预测的话题热度。
进一步的,所述步骤A中,计算话题相关的用户影响力,包括以下步骤:
步骤A1:定义话题依存度,表示两个用户在话题tp下的相关程度,计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410368076.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:户外燃气计量柜
- 下一篇:供电模块、开关电源芯片以及开关电源系统