[发明专利]一种基于传播图神经网络的互联网谣言检测方法在审
| 申请号: | 202011520193.5 | 申请日: | 2020-12-21 |
| 公开(公告)号: | CN112732906A | 公开(公告)日: | 2021-04-30 |
| 发明(设计)人: | 曹建军;皮德常;翁年凤;吴致远;江春;陈俊夫;丁鲲;瞿雷 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/08 |
| 代理公司: | 江苏瑞途律师事务所 32346 | 代理人: | 韦超峰;金龙 |
| 地址: | 410073 湖*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 传播 神经网络 互联网 谣言 检测 方法 | ||
本发明公开了一种基于传播图神经网络的互联网谣言检测方法,属于深度学习技术领域。包括获取待检测网页中用户的评论或回复结构,构建传播图;获取待检测网页中的文本数据,构建文本的向量表示;将文本的向量表示作为传播图中节点的初始状态,并利用基于门控循环单元的图神经网络更新传播图中节点的向量表示,根据传播图中节点的向量表示对待检测谣言进行分类,同时,本发明还引入注意力机制,动态地调整传播图中各个节点的权重。利用本发明的方法,能够高效准确地对谣言进行检测。
技术领域
本发明属于深度学习技术领域,具体涉及一种基于传播图神经网络的互联网谣言检测方法。
背景技术
在现实中,谣言检测存在诸多挑战:1)信息量大。社交网络上每时每刻都在产生新的新闻和资讯,并且内容涉及各个领域。为了检测谣言,需要处理大量的信息;2)实效性高。社交网络上的用户活跃度高,新闻资讯短时间内传播范围广,对于虚假的谣言必须能够尽早发现,以防止恶劣影响的传播;3)识别困难。有些谣言是精心设计的,有意图和导向性的,不仅普通用户甚至专业人士也难以分辨其真假。
为了能够检测互联网谣言,提出了很多互联网谣言的检测方法,例如申请号为201911158422.0的中国专利公开了一种基于图神经网络的谣言立场检测方法、装置和电子设备。该专利包括:获取谣言数据;根据所述谣言数据的特征构建异构图,其中,所述异构图包括多个节点,所述节点用于表示所述谣言数据;将所述异构图输入图神经网络模型,得到对所述节点的立场分类结果,其中,所述立场分类结果是由所述图神经网络模型确定所述节点的目标特征,并根据每个所述节点的目标特征经过分类得到的。
但是现有方法对于谣言的检测时,面对大量的网络数据时,检测效率不高,准确性相对较差,从而很难有效应对上述的挑战,因此,还需对谣言检测的方法进行深入研究。
发明内容
技术问题:本发明针对现有技术在进行谣言检测时,检测效率地以及准确性不足的问题,提供一种基于传播图神经网络的互联网谣言检测方法,该方法具有较高的检测效率和准确率,实现快速准确地检测谣言的目的。
技术方案:本发明的基于传播图神经网络的互联网谣言检测方法,包括:
步骤S1:获取待检测网页中用户的评论或回复结构,构建传播图;
步骤S2:获取待检测网页中的文本数据,构建文本的向量表示;
步骤S3:将文本的向量表示作为传播图中节点的初始状态,并利用基于门控循环单元的图神经网络更新传播图中节点的向量表示,根据传播图中节点的向量表示对待检测谣言进行分类。
进一步地,步骤S1包括:
获取网页中消息的评论、回复和转发关系,构建传播树结构;
对于传播树中存在的路径,添加方向相反的路径,构成传播图。
进一步地,步骤S2包括:
获取待检测网页中的文本数据,并将文本中的每个单词表示为词向量;
对每个文本中的词向量取均值,作为文本的向量表示。
进一步地,采用word2vec算法将文本中的每个单词表示为词向量。
进一步地,利用基于门控循环单元的图神经网络对传播图中节点的向量表示进行更新,节点v的向量表示从时间步t-1到t的更新过程为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011520193.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种方管多复合斜面的铣削方法
- 下一篇:一种电池寿命评估方法





