[发明专利]基于情感感知和图卷积网络的社交网络谣言检测方法在审
| 申请号: | 202310037032.8 | 申请日: | 2023-01-10 |
| 公开(公告)号: | CN116431760A | 公开(公告)日: | 2023-07-14 |
| 发明(设计)人: | 刘小洋;李慧 | 申请(专利权)人: | 重庆理工大学 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/9536;G06Q50/00;G06F40/289;G06F40/30;G06F18/241;G06N3/0464;G06N3/08 |
| 代理公司: | 重庆天成卓越专利代理事务所(普通合伙) 50240 | 代理人: | 王宏松 |
| 地址: | 400054 *** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 情感 感知 图卷 网络 社交 谣言 检测 方法 | ||
1.一种基于情感感知和图卷积网络的社交网络谣言检测方法,其特征在于,包括以下步骤:
S1,提取融合情感信息的语义特征:使用word2vec将帖子和评论共同构建为一个文本序列,接着从文本序列中提取文本的情感特征,然后利用多头注意力机制或多头自注意力机制将得到的情感特征和文本序列相融合后提取具有情感信息的语义特征;
S2,提取传播结构特征:利用源帖和评论转发作为节点,构建帖子的传播结构图,接着利用GCN提取传播结构中的隐藏特征,得到传播结构特征;
S3,将情感信息的语义特征和传播结构特征进行了特征融合得到谣言的融合特征;
S4,将所述融合特征输入谣言检测分类器,进行谣言预测分类。
2.根据权利要求1所述的一种基于情感感知和图卷积网络的社交网络谣言检测方法,其特征在于,所述从文本序列中提取文本的情感特征是从情感分类和情感词典两方面进行文本内容特征提取的;
基于情感词典的情感特征提取,是使用情感分类器去获得帖子文本的情感分类特征;
基于情感词典的情感特征提取包括以下步骤:
对于情感词典,将情感词典记为D={d1,d2,...,dm},其中情感词典D包含m种情感,对于情感d∈D,情感字典提供了一个包含L个情感单词的单词表f为情感词;
对于情感d,首先计算单词级别的得分score(ci,d),其中ci是文本序列C中的第i个单词,如果单词ci在中,则需考虑出现频率以及其上下文中的程度副词和否定词;
接着对文本分词,找出文档中的情感词f、否定词以及程度副词,然后判断每个情感词之前是否有否定词及程度副词,将它之前的否定词和程度副词划分为一个组,如果有否定词,则将情感词的情感权值乘以否定词的值,如果有程度副词就乘以程度副词的程度值,然后将所有组的得分加起来,大于0的归于正向,小于0的归于负向,此外得分的绝对值大小反映了文本的消极或积极的程度,通过这种方式获得每个单词的情感得分,其计算方式如下:
其中score(ci,d)表示单词ci的情感得分;
ci表示第i个单词;
表示ci是否存在于单词表中;
neg(ci,s)表示左侧上下文的窗口大小为s的情况下,单词ci的负值;
deg(ci,s)表示左侧上下文的窗口大小为s的情况下,单词ci的程度值;
L表示单词的总数量;
表示单词表;
s是单词左侧上下文的窗口大小,neg(cj)和deg(cj)分别是单词cj的负值和程度值,这些可以通过情感词典查找到;
然后将所有获得的单词的得分score(ci,d)进行相加,得到基于文本的情感得分score(C,d),文本情感得分的计算如下:
其中score(C,d)表示文本C的情感得分;
d表示一种情感;
D表示情感词典;
L表示单词的总数量;
最后将这些所有的文本级的情感得分进行拼接得到基于情感词典的情感特征:
其中dm表示第m种情感;
在得到基于情感词典的情感特征和基于情感词典的情感特征后,将所有获得的不同种类的情感特征进行拼接进而得到文本的情感特征emoC,如式所示:
其中emoC表示文本的情感特征,
表示不同种类的情感特征;
表示基于情感词典的情感特征;
为拼接符号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆理工大学,未经重庆理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310037032.8/1.html,转载请声明来源钻瓜专利网。





