[发明专利]谣言检测方法及设备有效

专利信息
申请号: 201810198553.0 申请日: 2018-03-12
公开(公告)号: CN108491480B 公开(公告)日: 2021-05-11
发明(设计)人: 周凯敏;何永;李传丰;武拥珍;舒畅;刘杰汉 申请(专利权)人: 义语智能科技(上海)有限公司
主分类号: G06F16/35 分类号: G06F16/35
代理公司: 上海百一领御专利代理事务所(普通合伙) 31243 代理人: 王奎宇;甘章乖
地址: 201203 上海市浦东新*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 谣言 检测 方法 设备
【说明书】:

发明的目的是提供一种谣言检测方法及设备,本发明通过谣言判别决策模块计算得到能判断和不能判断谣言的概率,若向所述GRU单元继续输入某一个消息矩阵后,对应计算得到的所述能判断谣言的概率大于预设阈值,则结束向所述GRU单元继续输入下一个消息矩阵,将最后一次更新的GRU单元状态发送给判别模块处理,旨在解决自动化决策何时进行事件谣言判断的问题,即在一个尽量早能做出准确判断的时间点。

技术领域

本发明涉及计算机领域,尤其涉及一种谣言检测方法及设备。

背景技术

谣言的传播会对社会造成很大的危害,尤其是在网络社交媒体上传播的谣言,其传播的范围更广、速度更快、造成的危害更加巨大。现有的技术大多关注谣言判断的准确性,很少关注谣言判断的时间点问题,有些做早期谣言检测的也只是划了一个固定的截止时间。

然而,对于谣言检测来说时效性是很重要的,主要是在于谣言实时监控中能及时作出准确的判断来。对于实时监控来说若采用人为划的固定截止时间,那么有些容易被判断的事件就可能被延迟判断,而一些比较难确定的事件就可能被草率的判断。所以现有的技术方案要么无法进行早期谣言检测,要么就是人工划定时间点不能达到更早更准的需求。

发明内容

本发明的一个目的是提供一种谣言检测方法及设备,能够解决现有的技术方案要么无法进行早期谣言检测,要么就是人工划定时间点不能达到更早更准的需求的问题。

根据本发明的一个方面,提供了一种谣言检测方法,该方法包括:

数据采集模块,监听采集相关帖子,包括目标对象发布的社交媒体的消息以及消息下的转发和评论内容,并按照固定的帖子条数采集一个序列的信息交由数据处理模块处理,同时若一段时间内没有新消息,则就将目前采集到的帖子作为一个序列的信息交由所述数据处理模块处理;

数据处理模块,从数据采集模块接收各个序列的信息,将每个序列的信息进行数据清洗后,再进行文本数值化处理得到消息矩阵,并将消息矩阵发送给谣言判别决策模块;

谣言判别决策模块,从所述数据处理模块依次接收各个消息矩阵,并将每一个消息矩阵经过一个神经网络和max pooling单元,将每一个消息矩阵转换为一个对应的矩阵向量;预设GRU(Gated Recurrent Unit)单元的初始状态为0向量,依次向所述GRU单元输入一个消息矩阵,所述GRU单元依照当前输入的消息矩阵和前一个GRU单元状态更新GRU单元的状态;依次记录更新得到的GRU单元状态,并依次将更新得到的GRU单元状态经过一个神经网络,并通过softmax输出,以计算得到能判断和不能判断谣言的概率;若向所述GRU单元继续输入某一个消息矩阵后,对应计算得到的所述能判断谣言的概率大于预设阈值,则结束向所述GRU单元继续输入下一个消息矩阵,将最后一次更新的GRU单元状态发送给谣言判别模块处理;

所述谣言判别模块,将最后一次更新的谣言GRU单元状态,经过一个神经网络,并通过softmax输出,以计算得到所述采集的消息是否为谣言的概率;

结果记录模块,记录下所述帖子和对应的计算得到的消息是否为谣言的概率。

进一步的,上述方法中,所述数据清洗包括:

先将每个序列的信息中的非中文的内容去除后,再对每个序列的剩余信息进行分词和去除停用词,得到每个序列对应的词序列;预设一个最大词长度,计算每个词序列中各个词的TF-IDF值,若某个词序列中的词的个数超过所述最大词长度,则在该词序列中保留所述TF-IDF值高于预设阈值的词,以得到保留后的词序列。

进一步的,上述方法中,所述进行文本数值化处理,包括:

用word2vec训练的词向量,将所述词序列或保留后词序列中的给个词转化为对应的词向量,按所述词序列或保留后词序列的词的顺序,将对应的词向量依次并列连接起来形成一个消息矩阵,其中,不足所述最大词长度的词序列或保留后词序列,对应的消息矩阵中用0向量填充。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于义语智能科技(上海)有限公司,未经义语智能科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810198553.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top