[发明专利]谣言检测方法、装置、电子设备及存储介质有效
申请号: | 202110673966.1 | 申请日: | 2021-06-17 |
公开(公告)号: | CN113496123B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 徐守志;向舜陟;董方敏;马凯;马圆圆;刘小迪 | 申请(专利权)人: | 三峡大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/216;G06F16/35;G06N3/08;G06N3/0442;G06N3/0464 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 程琛 |
地址: | 443002 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 谣言 检测 方法 装置 电子设备 存储 介质 | ||
本发明提供一种谣言检测方法、装置、电子设备及存储介质,谣言检测方法包括:获取新闻数据,并基于所述新闻数据,得到事件时间组合序列的向量化文本;基于所述向量化文本,得到评论特征信息以及双向的上下文关联特征信息;其中,所述评论特征信息包含有评论局部关联特征和评论全局关联特征;将所述评论特征信息以及所述上下文关联特征信息进行合并后,输入至全连接层,得到谣言检测结果。本发明提供的谣言检测方法,可以解决现有技术中谣言检测准确率低的缺陷,以提高谣言检测的准确率。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种谣言检测方法、装置、电子设备及存储介质。
背景技术
谣言在传播过程中会充斥着各种不同特征的观点评论,而这些评论在谣言传播的初期与末期所表现的结构、内容、形式上都会有明显的区别,而且谣言与非谣言的评论在整个事件的传播过程中也有所不同。将这些评论与原文相关联后,使用深度学习的方法将谣言与非谣言关联文本从语义内容上进行特征提取与对照,并运用到事件真实性的判断过程中去,是对事件真实性的一种检测方法。而现有的谣言检测方法对谣言进行检测时,准确率较低。
发明内容
本发明提供一种谣言检测方法、装置、电子设备及存储介质,用以解决现有技术中谣言检测准确率低的缺陷,以提高谣言检测的准确率。
本发明提供一种谣言检测方法,包括:
获取新闻数据,并基于所述新闻数据,得到事件时间组合序列的向量化文本;
基于所述向量化文本,得到评论特征信息以及双向的上下文关联特征信息;其中,所述评论特征信息包含有评论局部关联特征和评论全局关联特征;
将所述评论特征信息以及所述上下文关联特征信息进行合并后,输入至全连接层,得到谣言检测结果。
根据本发明提供的谣言检测方法,所述基于所述向量化文本,得到评论特征信息以及双向的上下文关联特征信息,包括:
将所述向量化文本输入至评论特征提取模型,得到所述评论特征信息;
将所述向量化文本输入至上下文关联特征提取模型,得到所述上下文关联特征信息;
其中,所述评论特征提取模型为,以所述向量化文本为样本,以预设的向量化文本对应的评论特征信息为样本标签,训练得到的深度金字塔卷积神经网络模型;
所述上下文关联特征提取模型为,以所述向量化文本为样本,以预设的向量化文本对应的上下文关联特征信息为样本标签,训练得到的Bi-LSTM网络模型,且所述Bi-LSTM网络模型的输出接入attention层。
根据本发明提供的谣言检测方法,所述深度金字塔卷积神经网络模型,依次包括区域嵌入层、第一等长卷积层、顺序堆叠的多层循环网络层,以及第二池化层,所述循环网络层包括第一池化层和第二等长卷积层;
且所述第一池化层为1/2池化层,第二池化层为输出池化层,所述区域嵌入层的输出与所述第一等长卷积层的输出残差连接,所述第一池化层的输出与所述第二等长卷积层的输出残差连接。
根据本发明提供的谣言检测方法,所述获取新闻数据,并基于所述新闻数据,得到事件时间组合序列的向量化文本,包括:
基于所述新闻数据,在社交媒体平台搜索所述新闻数据的关联内容作为样本数据;
对所述样本数据中的目标特征进行提取和标记,得到带标签文本;其中所述带标签文本含有文本内容和文本时间,以及转发评论的内容和时间;
基于所述文本时间和转发评论的时间,对所述带标签文本进行分组并组合,得到事件时间组合序列文本;
对所述事件时间组合序列文本进行分词和去除停用词操作,得到预训练文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三峡大学,未经三峡大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110673966.1/2.html,转载请声明来源钻瓜专利网。