[发明专利]一种基于传播影响力的网络谣言识别系统及方法在审
申请号: | 202110297717.7 | 申请日: | 2021-03-19 |
公开(公告)号: | CN113191144A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 段大高;白宸宇;韩忠明;张楚童;张秋丽 | 申请(专利权)人: | 北京工商大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京东方盛凡知识产权代理事务所(普通合伙) 11562 | 代理人: | 张换君 |
地址: | 100037*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 传播 影响力 网络 谣言 识别 系统 方法 | ||
1.一种基于传播影响力的网络谣言识别方法,其特征在于,具体包括如下步骤:
S101:对多个包含谣言信息的文本进行神经网络训练,得到文本特征矩阵;
S102:基于谣言信息的发布用户,得到第一用户节点信息矩阵;
S103:基于所述第一用户节点信息矩阵和所述发布用户在多个所述文本之间的转发和评论关系,构建传播图结构;
S104:基于所述传播图结构,构建发布用户传递注意力节点模型,并将所述第一用户节点信息矩阵输入该模型中,输出更新后的第二用户节点信息矩阵;
S105:根据所述更新后的第二用户节点信息矩阵和所述文本特征矩阵来训练神经网络模型,得到谣言识别模型;
S106:根据所述谣言识别模型识别网络谣言。
2.根据权利要求1所述的基于传播影响力的网络谣言识别方法,其特征在于,所述步骤S101具体为:
S101.1:对多个所述包含谣言信息的文本进行清洗和长度规范化;
S101.2:对多个所述文本中的单词进行神经网络训练,得到所述单词的词汇量;
S101.3:基于所述词向量,得到多个所述文本的第一词特征矩阵;
S101.4:将所述第一词特征矩阵通过注意力机制学习所述单词之间的依赖关系,得到第二词特征矩阵;
S101.5:将所述第二词特征矩阵输入卷积层和最大池化层,得到所述文本特征矩阵。
3.根据权利要求2所述的基于传播影响力的网络谣言识别方法,其特征在于,所述神经网络是采用Word2Vec中的Skip-Gram神经网络模型;所述Skip-Gram神经网络模型使用的窗口大小为5;所述词向量的嵌入维度为300。
4.根据权利要求2所述的基于传播影响力的网络谣言识别方法,其特征在于,所述步骤S101.4具体为:
将所述第一词特征矩阵通过相同的h组多头注意力机制进行学习,得到h组更新后的第一词特征矩阵,h为大于1的正整数;
将h组所述更新后的第一词特征矩阵连接起来,得到第二词特征矩阵。
5.根据权利要求1所述的基于传播影响力的网络谣言识别方法,其特征在于,所述步骤S102具体为:
将发布谣言信息的用户作为节点,并将所述节点给予一定顺序;并对不同用户的节点采用Node2Vec方法进行学习,得到不同用户节点嵌入信息,将得到的给定顺序中的不同用户节点嵌入信息构成构成第一用户节点信息矩阵。
6.根据权利要求1所述的基于传播影响力的网络谣言识别方法,其特征在于,所述步骤S103具体为:
构建传播图结构,所述图结构中的节点为多个所述用户节点嵌入信息,所述图结构中的邻接矩阵为所述谣言信息的发布用户在多个所述文本之间的转发和评论关系;将谣言信息对应的用户节点,并根据所述转发和评论关系,构成传播图结构。
7.根据权利要求1所述的基于传播影响力的网络谣言识别方法,其特征在于,所述步骤S104具体为:
S104.1:学习相邻用户节点间的注意力系数sij;
S104.2:对每个用户节点的所有邻居的注意力系数eij进行归一化,并更新影响力矩阵M下的所述第一用户节点信息矩阵
S104.3:基于注意力矩阵,构建传递注意力矩阵M′;并通过所述传递注意力矩阵,学习其他节点做为中间节点在内的节点i和节点j的影响力系数e′ij,并对其进行归一化,更新传递注意力矩阵M′下的所述第一用户节点信息矩阵
S104.4:将经过不同注意力矩阵M和M′更新后的第一用户节点信息和合并,得到更新后的二用户节点信息
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学,未经北京工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110297717.7/1.html,转载请声明来源钻瓜专利网。