[发明专利]一种面向社交网络的热点事件预测方法有效
| 申请号: | 202111032195.4 | 申请日: | 2021-09-03 |
| 公开(公告)号: | CN113806534B | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 田玲;许毅;惠孛;张栗粽;罗光春;冀柯曦;樊美琦 | 申请(专利权)人: | 电子科技大学 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/34;G06F40/289;G06N3/042;G06N3/0464;G06N3/048;G06Q10/04;G06Q50/00 |
| 代理公司: | 电子科技大学专利中心 51203 | 代理人: | 甘茂 |
| 地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 社交 网络 热点 事件 预测 方法 | ||
本发明属于热点事件预测技术领域,具体提供一种面向社交网络的热点事件预测方法,用以解决现有技术中文本数据价值挖掘不够、动态时序特征与上下文语义信息利用不充分等技术问题。本发明首先,基于图卷积神经网络捕捉文本邻域语义信息,能够充分挖掘关键词语之间的依存关系;其次,提出维度注意力机制,改进图神经网络的动态分层传播方式,通过维度注意力机制生成重点特征摘要,并将其用于缩放原特征,自适应地调整各个维度特征响应值,增加事件预测中有价值词语的权重,同时抑制价值较弱词语的权重,即充分捕捉社交网络文本时变信息;最终,基于关键词语邻域信息与时序信息充分挖掘文本数据价值,提高模型预测的准确率,具有实用价值。
技术领域
本发明属于热点事件预测技术领域,涉及图神经网络在热点事件预测技术中的应用,具体提供一种面向社交网络数据的基于动态图神经网络的热点事件预测方法。
背景技术
如今,社交网络已经逐渐渗入人们生活各个方面,包括社会、政治和经济等;社交网络开放性强、信息传播迅速,吸引了海量用户,成为公众发布社会消息、讨论现实事件的重要渠道;社交网络事件通常是现实事件在网络空间的映射,大量研究人员展开面向社交网络的热点事件预测研究。有学者从数学上将热点事件预测问题定义为预测一个可观测的事件在未来是否会成为热点,目前研究面向社交网络的热点事件预测任务主要包含以下三类:预测网络事件是否成为热点、预测事件在某个时间热度值、预测事件变热的概率,根据预测方法的不同将其分为基于传统机器学习和基于深度学习两种方法。
Suh等人针对单条推文流行度预测问题,基于用户信息、文本内容,利用主成分分析(PCA)与广义线性模型(GLM)寻找早期特征与转发数量之间的关系。Zhang等人则选择事件相关文本,用户兴趣、影响力以及历史流行度实现流行度线性函数建模,解决事件下一时刻流行度预测问题。目前现有研究事件预测问题大多围绕用户属性、级联关系等特征,较少研究考虑利用文本信息对热度变化进行建模。Geng等人提出一种基于推特数据的时空事件预测生成模型,该模型通过对结构背景和时空突发性联合建模,刻画未来事件的潜在发展。Deng等人提出的动态图卷积神经网络(DGCN)利用事件上下文,以动态图结构形式对节点信息建模,揭示节点之间隐藏的关联信息,分析单词之间隐藏时序联系,能够影响未来事件预测效果。
社交网络用户之间相互关注,构成错综复杂的网络结构,信息传播演变模式更加复杂,数据具有多维、多源和异构等特点,现有方法主要利用机器学习方法。基于传统机器学习方法多是特征驱动的,许多特征是由专家根据先验知识而精心设计的,该类方法性能较多依赖于特征表示,但没有明确统一设计、测量特征原则,存在丢失重要信息的可能性。而基于深度学习方法可解释性较差,难以直观描述事件热度变化的原因,不能充分捕捉社交网络中信息时变的活跃水平。此外,用户发布在社交网络的信息以文本内容为主,在以往针对热度预测问题的研究中,通常利用的文本信息只有事件或话题名称,没有充分利用社交网络文本数据;并且,文本数据价值稀疏,难以从中挖掘潜在有价值信息,事件文本内容更是随时间动态变化,应该充分考虑其时序特征。
发明内容
本发明的目的在于提供一种面向社交网络数据的基于图神经网络的热点事件预测方法,用以解决现有技术中文本数据价值挖掘不够、动态时序特征与上下文语义信息利用不充分等技术问题。
为实现上述目的,本发明采用的技术方案如下:
一种面向社交网络的热点事件预测方法,包括以下步骤:
步骤1、对源数据进行数据预处理得到文本数据,并对每条文本数据进行0、1分类标记,获得样本数据;
步骤2、根据预定时序将样本数据构建为带有节点特征的时序图结构数据,利用图卷积神经网络对时序图结构数据进行处理,通过图卷积模块进行卷积操作,获得聚合关键词语邻域信息的文本特征向量;
步骤3、通过维度注意力机制对步骤2所得文本特征向量进行编码,捕捉其时序相关性,获得聚合关键词语邻域信息与时序信息的文本特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111032195.4/2.html,转载请声明来源钻瓜专利网。





