[发明专利]基于情感感知和图卷积网络的社交网络谣言检测方法在审
| 申请号: | 202310037032.8 | 申请日: | 2023-01-10 |
| 公开(公告)号: | CN116431760A | 公开(公告)日: | 2023-07-14 |
| 发明(设计)人: | 刘小洋;李慧 | 申请(专利权)人: | 重庆理工大学 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/9536;G06Q50/00;G06F40/289;G06F40/30;G06F18/241;G06N3/0464;G06N3/08 |
| 代理公司: | 重庆天成卓越专利代理事务所(普通合伙) 50240 | 代理人: | 王宏松 |
| 地址: | 400054 *** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 情感 感知 图卷 网络 社交 谣言 检测 方法 | ||
本发明提出了一种基于情感感知和图卷积网络的社交网络谣言检测方法,包括以下步骤:S1,提取融合情感信息的语义特征:将帖子和评论共同构建为一个文本序列,接着从文本序列中提取文本的情感特征,然后将得到的情感特征和文本序列相融合后提取具有情感信息的语义特征;S2,提取传播结构特征:利用源帖和评论转发作为节点,构建帖子的传播结构图,接着利用GCN提取传播结构中的隐藏特征,得到传播结构特征;S3,将情感信息的语义特征和传播结构特征进行了特征融合得到谣言的融合特征;S4,将所述融合特征输入谣言检测分类器,进行谣言预测分类。本发明在谣言检测中考虑了帖子所传达的情感信息和传播结构,本发明方法谣言检测的准确率有很大的提升。
技术领域
本发明涉及自然语言处理技术领域,特别是涉及一种基于情感感知和图卷积网络的社交网络谣言检测方法。
背景技术
随着互联网的发展,各种在线社交平台逐渐取代早期的报纸期刊成为人们获取新闻资讯的主要途径。随着越来越多的人在互联网上参与讨论热门话题,许多谣言出现了。中国互联网络信息中心(CNNIC)发布的第48次《中国互联网络发展状况统计报告》显示,截至2021年6月,我国网民规模达10.11亿,他们活跃在各种社交网络平台,在上面发布自己的想法。由于社交媒体用户数量众多,且在线社交平台为网民的参与讨论提供了广阔的平台,谣言在社交媒体上的传播速度更加迅速,传播范围也更加广泛,为个人、社会和国家带来严重的危害,造成巨大的经济损失。从广义上讲,虚假信息是故意传播以误导或欺骗为目的的虚假或者不准确的消息。它对无论是社会还是个人都有极大的影响。Soroush等在《Science》上发表的最新成果将虚假信息与真实信息的传播结构进行了对比,发现虚假信息的传播范围更远、更快、更深、更广。此外,新媒体技术的发展也加速了信息在社会面上大规模的传播,降低了社交网络信息产生的成本,为虚假信息的传播提供了极大的便利。
目前的谣言检测主要是从发布的帖子文本的语义特征或者传播结构特征方面对帖子是谣言还是真实信息进行检测。然而,许多基于文本的谣言检测方法完全没有考虑文本的情感特征。以往的研究中有学者提出并验证了虚假信息或谣言与网络文本的情感之间存在一定关系(否定词与肯定词数量之比),并提取了帖子中的情感特征以进行谣言检测,但是没有考虑评论中的情感因素。除了帖子本身的情感特征之外,帖子的评论中也包含了大量公众的情感特征,公众的情感特征对于帖子的真假辨别往往也具有重要作用。因此,除了帖子本身的情感特征之外,公众的情感特征也需要被关注以用于谣言检测。此外,根据相关研究,谣言和真实信息在网络上的传播结构有很大的不同,且许多学者的研究证明,谣言的传播结构特征对谣言的识别有重要意义。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种基于情感感知和图卷积网络的社交网络谣言检测方法。
为了实现本发明的上述目的,本发明提供了一种基于情感感知和图卷积网络的社交网络谣言检测方法,包括以下步骤:
S1,提取融合情感信息的语义特征:使用word2vec将帖子和评论共同构建为一个文本序列,接着从文本序列中提取文本的情感特征,然后利用多头注意力机制或多头自注意力机制将得到的情感特征和文本序列相融合后提取具有情感信息的语义特征;
S2,提取传播结构特征:利用源帖和评论转发作为节点,构建帖子的传播结构图,接着利用GCN提取传播结构中的隐藏特征,得到传播结构特征;
S3,将情感信息的语义特征和传播结构特征进行了特征融合得到谣言的融合特征;
S4,将所述融合特征输入谣言检测分类器,进行谣言预测分类。
GCN能够更好地从图中或者树中捕获全局结构特征,Attention机制能更好的聚合文本内容以从中获得更加关键的隐藏特征。
进一步地,所述从文本序列中提取文本的情感特征是从情感分类和情感词典两方面进行文本内容特征提取的;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆理工大学,未经重庆理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310037032.8/2.html,转载请声明来源钻瓜专利网。





