[发明专利]基于图神经网络的谣言立场检测方法、装置和电子设备有效
申请号: | 201911158422.0 | 申请日: | 2019-11-22 |
公开(公告)号: | CN111159395B | 公开(公告)日: | 2023-02-17 |
发明(设计)人: | 王丽宏;李晨;贺敏;毛乾任 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/08 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 郭金鑫 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 谣言 立场 检测 方法 装置 电子设备 | ||
1.一种基于图神经网络的谣言立场检测方法,其特征在于,包括:
获取谣言数据;
根据所述谣言数据的特征构建异构图,其中,所述异构图包括多个节点,所述节点用于表示所述谣言数据;
将所述异构图输入图神经网络模型,得到对所述节点的立场分类结果,其中,所述立场分类结果是由所述图神经网络模型确定所述节点的目标特征,并根据每个所述节点的目标特征经过分类得到的;
所述根据所述谣言数据的特征构建异构图的步骤包括:根据所述谣言数据确定所述异构图的词节点和帖子节点;确定所述帖子节点的特征,根据所述帖子节点的特征确定所述词节点和帖子节点间的关系;根据所述词节点和帖子节点间的关系构建所述异构图;
所述根据所述谣言数据确定所述异构图的词节点和帖子节点的步骤包括:筛选所述谣言数据中出现频率达到设定次数的每个词作为一个词节点,将用户每次发表的意见作为一个帖子节点;
所述根据所述帖子节点的特征确定所述词节点和帖子节点间的关系的步骤包括:将节点间的关系作为所述异构图中相连节点间的边,分别确定两个词节点、词节点与帖子节点、两个帖子节点间的边的权重,其中,所述节点间的关系按照与节点对应的词或帖子在所述谣言数据中的共现信息以及不同帖子在传播中的交互关系确定;
所述两个词节点的边的权重通过如下公式确定:
其中,所述两个词节点的边的权重由所述两个词节点在文本采样窗口中的共现频率确定,wi与wj表示两个词节点,为wi与wj共同出现的窗口个数,Nwindow为所述谣言数据中滑动窗口总数,与为wi与wj分别各自出现的滑动窗口次数;
所述词节点与帖子节点的边的权重按照词频-逆文档频率方法确定;
所述两个帖子节点的边的权重按照所述两个帖子节点对应的两个帖子的内容相似度确定。
2.根据权利要求1所述的方法,其特征在于,所述确定所述帖子节点的特征步骤包括:
确定所述帖子节点的语义特征、属性特征和传播特征:
筛选所述帖子节点中每个句子中的主干内容,将所述主干内容映射为词向量,将每个所述帖子节点中的词向量的平均值作为所述帖子节点的语义特征;
将所述帖子节点的长度、表情个数、发出时段及回复人数信息进行归一化处理后作为所述帖子节点的属性特征;
将所述帖子节点的传播深度、入度与出度的比值作为所述帖子节点的传播特征。
3.根据权利要求1所述的方法,其特征在于,所述将所述异构图输入图神经网络模型,并获取所述图神经网络模型输出的所述异构图的每个节点的目标特征的步骤包括:
将所述异构图输入单层图神经网络模型,得到与每个节点相邻的一阶节点的特征;
将多个单层图神经网络模型堆叠,得到与每个节点相邻的多阶节点的特征。
4.根据权利要求1所述的方法,其特征在于,所述根据每个所述节点的特征对所述节点的立场分类的步骤包括:
将所述图神经网络模型确定的所述节点的目标特征输入全连接层,并利用分类函数层对所述节点的立场进行分类后输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911158422.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:区块链在线存证方法与系统
- 下一篇:检测证件水印的方法、装置、设备及存储介质