[发明专利]基于网络信息传播图建模的社交媒体谣言检测方法有效
申请号: | 202011211346.8 | 申请日: | 2020-11-03 |
公开(公告)号: | CN112199608B | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 毛震东;张勇东;柳轩;张坤;张铧天 | 申请(专利权)人: | 北京中科研究院;人民网股份有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06N3/04 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;韩珂 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 网络 信息 传播 建模 社交 媒体 谣言 检测 方法 | ||
1.一种基于网络信息传播图建模的社交媒体谣言检测方法,其特征在于,包括:
以用户的帖子为节点,根据帖子的转发层次关系和时间维度关系建立传播图模型,并且根据用户的ID信息在传播图模型中构建相同用户的帖子连接关系;其中,对于同一条帖子的转发回复帖子中,存在时间维度上的连接关系;
将预训练模型提取的各个帖子的文本特征作为初始的节点表示特征,并利用消息传递图神经网络根据帖子之间关系进行信息的聚合,进而更新节点表示特征,包括:设计了依赖于关系类型的信息聚合函数,即通过关系感知的消息传递图神经网络进行节点表示学习;首先,定义关系感知的消息聚合函数为:
其中,为节点vi进行信息聚合后的表示特征,l=1…L表示第L层图神经网络,L为总层数,表示与节点vi的属于关系r的一阶邻居节点集合,一阶邻居表示直接相连的节点,r∈{rretweet,rtemporal,ruser},rretweet、rtemporal、ruser依次表示两个节点为转发层次关系、时间维度关系、属于相同用户的关联关系;表示邻居节点个数,和为可学习权重参数;表示节点vi在第l-1层图神经网络的节点表示特征,为节点vk在第l-1层图神经网络的节点表示特征;
然后,通过门控循环神经单元更新节点表示特征,表示为:
最终,得到节点vi在第L层图神经网络的节点表示特征
将更新后的节点表示特征与初始的节点表示特征连接后,通过分类器预测帖子为谣言的概率。
2.根据权利要求1所述的一种基于网络信息传播图建模的社交媒体谣言检测方法,其特征在于,所述传播图模型表示为G=(V,E,R,H0),其中,V为节点集合,E为边集合;R为关系类型的集合,rij∈R表示两个节点vi与vj之间的关系类型,也即,vi,vj∈V,i,j=1…n,n为节点个数;为初始的节点表示矩阵,为初始的节点表示特征;
关系类型包含{rretweet,rtemporal,ruser}三类。
3.根据权利要求1或2所述的一种基于网络信息传播图建模的社交媒体谣言检测方法,将更新后的节点表示特征与初始的节点表示特征连接:
通过一个线性分类器预测帖子为谣言的概率:
Pi=softmax(Wchi+bc)
其中,Wc与bc为线性分类器中可学习的权重与偏置参数。
4.根据权利要求1所述的一种基于网络信息传播图建模的社交媒体谣言检测方法,其特征在于,该方法构成一个检测模型,训练阶段的损失函数为交叉熵损失,表示为:
其中,N是训练样本中帖子总数,C为谣言的类别数,yc(xu)、Pu分别表示对于c类别的第u个样本的真实标签、预测出为谣言的概率,表示对于所有模型参数θ的正则项,γ为正则化参数。
5.根据权利要求1所述的一种基于网络信息传播图建模的社交媒体谣言检测方法,其特征在于,所述预训练模型为BERT模型;对于每一帖子的文本信息,首先进行数据清洗预处理,去除不必要内容,所述不必要内容包括:去除特殊字符、URL超链接、HTML字符以及表情符号;预处理完成后,使用BERT模型对文本中的句子进行处理,并利用BERT模型倒数第二层的隐藏层平均作为句子的文本特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科研究院;人民网股份有限公司,未经北京中科研究院;人民网股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011211346.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法和装置
- 下一篇:一种雷达海上试验用充气式角反射器
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置