[发明专利]一种融合情感挖掘的谣言检测方法及系统在审
| 申请号: | 202211139407.3 | 申请日: | 2022-09-19 |
| 公开(公告)号: | CN115422945A | 公开(公告)日: | 2022-12-02 |
| 发明(设计)人: | 陈羽中;朱文龙;饶孟宇;万宇杰 | 申请(专利权)人: | 福州大学 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/211;G06F16/36;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 郭东亮;蔡学俊 |
| 地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 融合 情感 挖掘 谣言 检测 方法 系统 | ||
1.一种融合情感挖掘的谣言检测方法,其特征在于:所述方法包括以下步骤;
步骤A:收集并提取社交网络媒体中源帖子的文本内容和评论内容,并人工标注源帖子的真实标签,形成训练数据集DT;
步骤B:使用训练数据集DT,训练基于多级注意力和知识图谱的深度学习网络模型N,训练内容包括分析源帖子的真实性和预测源帖子的真实性标签;
步骤C:将源帖子的文本内容和评论内容输入到训练好的深度学习网络模型N中,获得源帖子的真实性标签。
2.根据权利要求1所述的一种融合情感挖掘的谣言检测方法,其特征在于:所述步骤B包括以下步骤;
步骤B1:对训练数据集DT中的每个训练样本进行编码,以得到文本内容的初始表征向量Tst、评论内容的初始表征向量Trt以及句法邻接矩阵Ast;
步骤B2:根据句法知识子图构造算法从知识图谱和句法依赖图中生成文本内容的对应的句法知识子图SK,并得到其邻接矩阵ASK,然后对其节点进行编码,得到句法知识子图SK的节点知识表示向量HSK;
步骤B3:将步骤B1得到的文本内容初始表征向量Tst输入到双向长短期记忆网络Bi-LSTM中,得到上下文增强的文本内容表征向量Hst,令Ust=Hst;然后,将表征向量Tst和评论内容初始表征向量Trt一起输入到多头交叉注意力机制中,得到基于文本内容的评论表征向量Psr,同时将表征向量Tst输入到多头自注意力机制中,得到文本内容增强表征向量Ps;然后通过把基于文本内容的评论表征向量Psr和文本内容增强表征向量Ps分别输入到池化层中进行平均池化操作,得到平均池化评论内容句子表征向量和平均池化文本内容增强表征向量
步骤B4:将子图SK的节点知识表示向量HSK和将步骤B3得到的表征向量Ust分别输入到两个具有K层的图卷积网络中,记为文本知识图卷积网络SKGCN和文本内容图卷积网络SCGCN,用于学习外部知识信息和提取句法信息;同时利用知识引导机制将文本内容图卷积网络SCGCN的每层节点与文本知识图卷积网络SKGCN进行知识引导,得到源帖子的图知识表征向量Vsks;
步骤B5:通过使用交叉注意力机制将B4步骤得到的图知识表征向量Vsks和句子表征向量Ust融合,得到知识增强型句子级表征向量Esd,以进一步提高模型提取信息的能力;然后通过多头自注意力机制将Esd进一步加强,得到聚合词级信息的句子表征Emt;再通过门控机制减少来自不规范句子的噪声,得到源帖子情感表征向量Esf;
步骤B6:将源帖子对应的平均池化评论内容句子表征向量和平均池化文本内容增强表征向量一起输入到多头交叉注意力机制中,并通过平均池化得到评论内容的综合语义表征Csr;然后将平均池化文本内容增强表征向量和评论内容的综合语义表征Csr输入到融合门控机制中,得到源帖子的细粒度语义表征向量Vt;
步骤B7:将步骤B5得到的情感表征向量Esf与步骤B6得到的源帖子的细粒度语义表征向量Vt结合,得到最终表征向量Ef;然后将Ef输入全连接层和softmax函数,得到预测结果;再根据目标损失函数loss,利用反向传播方法计算深度学习网络模型中各参数的梯度,并利用随机梯度下降方法更新各参数;
步骤B8:当深度学习网络模型N产生的损失值迭代变化小于所给定阈值、或者达到最大迭代次数,则终止深度学习网络模型N的训练过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211139407.3/1.html,转载请声明来源钻瓜专利网。





