[发明专利]基于图神经网络的谣言立场检测方法、装置和电子设备有效
申请号: | 201911158422.0 | 申请日: | 2019-11-22 |
公开(公告)号: | CN111159395B | 公开(公告)日: | 2023-02-17 |
发明(设计)人: | 王丽宏;李晨;贺敏;毛乾任 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/08 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 郭金鑫 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 谣言 立场 检测 方法 装置 电子设备 | ||
本申请涉及一种基于图神经网络的谣言立场检测方法、装置和电子设备,所述方法包括:获取谣言数据;根据所述谣言数据的特征构建异构图,其中,所述异构图包括多个节点,所述节点用于表示所述谣言数据;将所述异构图输入图神经网络模型,得到对所述节点的立场分类结果,其中,所述立场分类结果是由所述图神经网络模型确定所述节点的目标特征,并根据每个所述节点的目标特征经过分类得到的。本申请通过构建异构图,使用图神经网络进行图表征学习,无需依赖较大的数据规模,快速高效捕获目标帖子的邻居分布特征及跨主题特征,实现对帖子的立场进行分类。
技术领域
本申请涉及互联网技术领域,尤其涉及一种基于图神经网络的谣言立场检测方法、装置和电子设备。
背景技术
随着互联网的发展,每天,数十亿用户可以使用社交媒体实时获取新闻,分享观点和与他人互动,这显著提高了信息的传播速度和范围。然而,社交媒体上的信息内容往往缺乏必要的管理,大量虚假或未经证实的信息将与真实信息混杂在一起进行发布。社交媒体的普及使其便于信息获取,但实际上加剧了谣言对互联网乃至现实世界的影响。尽早地识别出社交媒体中流传的谣言是一项十分有意义的任务。
谣言的社会学定义是“未经证实且与工具相关的信息陈述”在流通中,其任务旨在确定给定信息的真实性。传统方法将谣言检测视为有监督的分类任务,它从帖子内容,用户档案和传播模式中收集和编码大量手工特征,以训练有效的分类器。此外,还有一些基于规则的方法来挖掘特殊的谣言传播模式。最近,为了通过数据驱动获得更有价值的特征(例如,语义分布和传播结构),已经提出了一些基于深度神经网络或树核的方法。
特别的,一些工作侧重于将帖子的态度作为判断谣言真实性的重要信号。它涉及到一个与谣言检测密切相关的研究课题:谣言立场检测,目的是确定给定文本对特定目标的态度。与传统的文本分类任务相似,已有许多基于语义和统计特征的方法被应用于对给定文本的立场进行分类。其中,特征构建方法要么是早期的特征工程和统计模型,要么是最近的基于深度神经网络的模型。最近,一些工作尝试将更丰富的手工制作的特性注入神经网络,并取得了更好的结果。具体来说,现有方法主要包括:
(1)基于手工特征的有监督文本分类方法;
(2)基于传统机器学习模型的谣言建模方法;
(3)基于深度神经网络的谣言建模方法。
现有方法在进行谣言立场检测时存在大量不足:
首先,谣言的传播以及谣言的内容普遍是独立的,而现有模型普遍针对谣言进行独立的建模,没有尝试挖掘谣言间的共有特征。这会导致挖掘到的特征极易带有大量的非重现特征,难以应用到大规模的社交文本中。
其次,现有谣言立场检测方法在进行建模普遍没有考虑谣言的上下文信息,丢失了大量显著的社会学特征,例如:持有询问(Query)立场的帖子下文较其他立场(如评论)更大概率出现带有情感极性立场的回帖。
再次,谣言主题及文本生成速度极快,但校验时间及过程却极为繁琐,因此标注数据花费极高。现有部分模型(特别是深层模型)的性能极大依赖于数据规模,因此在数据较少、乃至冷启动时会使模型性能急速下降。
此外,由于谣言的传播极易造成社交网络中悲伤、恐惧、愤怒等极端情感的快速蔓延,因此尽可能的在早期检测谣言立场分布,对谣言真实性的判断有极大的帮助。
发明内容
为了解决如何准确快速检测出谣言立场的技术问题,本申请提供了一种基于图神经网络的谣言立场检测方法、装置和电子设备,通过构建异构图,使用图神经网络进行图表征学习,快速高效捕获目标帖子的邻居分布特征及跨主题特征,实现对帖子的立场进行分类。
第一方面,本申请提供了一种基于图神经网络的谣言立场检测方法,包括:
获取谣言数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911158422.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:区块链在线存证方法与系统
- 下一篇:检测证件水印的方法、装置、设备及存储介质