[发明专利]一种基于用户行为的话题流行度预测系统及方法有效
| 申请号: | 201910114603.7 | 申请日: | 2019-02-14 |
| 公开(公告)号: | CN109829114B | 公开(公告)日: | 2023-05-26 |
| 发明(设计)人: | 谢小秋;肖云鹏;杜江;刘宴兵;梁霞;帅杰 | 申请(专利权)人: | 重庆邮电大学 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q10/04;G06Q50/00 |
| 代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红;陈栋梁 |
| 地址: | 400065 重*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 用户 行为 话题 流行 预测 系统 方法 | ||
本发明请求保护一种基于用户行为的话题流行度预测系统及方法。它的具体步骤为:获取数据、转发驱动力量化、动力学模型构建三个部分。首先,通过网络爬虫抓取web中的内容获取社交网络用户数据。然后,分析影响用户转发的个人和社交转发驱动力,利用多元线性回归量化转发驱动概率。其次,考虑真实社交网站中,信息传播具有沿关注关系层级传播的特点,重构SIR模型中信息传播的规则。最后,将量化后的转发驱动力引入到SIR模型中,结合时间切片技术,刻画时间特性引起的感染率的动态变化过程,利用最小二乘法拟合模型真实参量,构建信息流行度态势变化趋势,预测信息转发数。本发明提高了话题流行度预测准确度。
技术领域
本发明属于社交网络信息传播预测领域,主要涉及用户行为分析和量化,构建一种更真实的社交网络信息传播模型,并基于该模型预测话题的流行度。
背景技术
随着互联网技术的发展,在线社交网络已逐渐成为人们获取信息、交流信息的重要平台,对人们的工作生活产生了巨大的影响。与此同时,社交网络中数据呈现爆炸式的增长趋势,使得一个话题或者一条消息在短时间内达到数百万的关注用户,从而发展成为高热度话题,诸如消息过载、虚假信息泛滥等问题也随之而来。而信息流行度的预测为分析和解决这一问题提供帮助,并成为研究的热点。在舆情监控上,预测话题信息态势变化有利于利支持网络安全预警和辅助决策;在网络营销方面,准确估计信息的流行度可以帮助商家合理的进行商品推荐和广告投放;在微博影响力评估上,预测信息流行度能够动态刻画热度态势变化趋势,进而应用于微博话题热搜排序。
目前,关于流行度的研究主要集中于在线视频、微博、话题标签等。多数研究工作中,研究者通常将流行度定义量化为某种数量,如视频的观看数、微博的点赞数、话题标签的出现次数等。关于流行度的预测方法,主要包括三类:基于时间序列的方法、基于分类和回归的方法、基于传染病的方法。其中,基于传染病模型的方法是研究信息的传播过程和动力学成因的基础,也是信息流行度预测的一个重要工具。在线社交网络中,信息的传播过程类似生物学中传染病的传播过程,可以将信息视为传染病,进而对疾病在人群中的表现和分布式进行计算建模。传染病模型包括SI、SIS、SIR三类。
前面提到信息传播的过程类似传染病的过程,但是仍然存在很多不同的地方。一方面,由于社交网络平台具有公开特性,在SIR模型中假设三种人群接近常数变得不合理。另一方面,在生物种群中,当一个个体感染某种疾病后,除了一些有抗体的免疫个体外,网络中其余个体是易感染者,其都有机会接触到感染个体。然而,在线社交网络中,消息是沿着关注关系传播的,只有用户关注者转发了这条消息,用户才有机会以粉丝的身份接收到信息,成为易感染者。所以说,网络中的易感染者大多数来自感染者的粉丝。考虑以上问题,我们基于传统SIR模型,引入过渡状态F,构建F-SIR模型,其中F表示感染者的粉丝,是感染者的粉丝到易感染的一个过渡状态。
此外,传统SIR模型参数训练中,往往人为的设定固定的群体状态转换概率来构建完整的SIR预测传播网络。这样的话,一方面,人为设定的参数具有随机性且缺乏理论依据;另一方面,忽略了话题传播过程中时间特性引起的转换概率的动态变化,使得预测值和真实值有较大的差量。本发明从微观用户角度出发,提取用户个人和社交维度的转发驱动力,量化转发感染率,通过最小二乘算法训练获得模型参数。
发明内容
本发明旨在解决以上现有技术的问题。提出了一种提高流行度预测的准确度的基于用户行为的话题流行度预测系统及方法。本发明的技术方案如下:
一种基于用户行为的话题流行度预测系统,其包括:数据源获取模块、转发驱动力量化模块及话题流行度预测模型构建模块,
数据源获取模块,用于从现有的社交平台的API获取,或者通过网络爬虫抓取web中的内容获取社交网络用户数据;
转发驱动力量化模块,从用户个人和社交两个维出发,提取影响用户转发的个人转发驱动力和社交转发驱动力,利用多元性回归模型量化用户转发驱动力;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910114603.7/2.html,转载请声明来源钻瓜专利网。





