[发明专利]一种基于多任务学习的社交媒体谣言检测方法有效

专利信息
申请号: 202110269307.1 申请日: 2021-03-11
公开(公告)号: CN112685541B 公开(公告)日: 2021-05-25
发明(设计)人: 李芳芳;张盼曦;宁肯;刘志 申请(专利权)人: 中南大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/35;G06F16/9536;G06F40/205;G06F40/216;G06F40/284;G06F40/30;G06K9/62;G06N3/04;G06N3/08;G06Q50/00
代理公司: 长沙惟盛赟鼎知识产权代理事务所(普通合伙) 43228 代理人: 黄敏华
地址: 410000 湖南*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 任务 学习 社交 媒体 谣言 检测 方法
【说明书】:

发明涉及一种基于多任务学习的社交媒体谣言检测方法,具体包括如下步骤:S1:对语料进行数据提取及格式转换,获取帖子的源、回复及传播路径;S2:提取行文风格的特征;S3:提取用户置信度的特征;S4:对来源帖子及回复帖子中的文本部分做文本预处理,来输入后续任务;S5:将S2和S3提取到的特征与S4的文本表示做向量拼接;S6:将拼接后的向量放入一个共享的BERT层;S7:分别构建神经网络结构;S8:将S5处理后的数据输入神经网络结构中,输出立场分类和谣言分类。本发明能用多任务联合模型联合两个高度相关的任务,改进了谣言检测和立场分类任务,提高了谣言检测性能。

技术领域

本发明涉及谣言检测的技术领域,尤其涉及一种基于多任务学习的社交媒体谣言检测方法。

背景技术

近年来,随着社交媒体的快速发展,人们倾向于通过twitter, reddit等社交媒体查阅自己所关心的相关消息。然而,在这些社交媒体为我们的生活提供便利的同时,他们也导致信息泛滥和网络谣言大量传播的问题。谣言给人们的生产生活带来了很多危害,病毒式传播的谣言时常引起公众舆论,扰乱社会秩序,并给社会经济和政治带来负面影响。同时,谣言也会影响人们的判断力。

谣言的恶劣影响引发了大众的广泛关注,谣言检测技术亟待改进。由于传统的新闻媒体检测算法对社交媒体谣言检测任务是无效或不适用的,且故意撰写谣言以误导读者的情况难以检测,在社交媒体上进行谣言检测任务是具有挑战性的。传统的方法是采用常见的机器学习模型如Support Vector Machine (SVM) , Random Forest(RF)等进行特征分类,或使用深度学习RNN, LSTM, GCN等来模拟谣言信息流的传播结构。

发明内容

本发明的目的是提供一种基于多任务学习的社交媒体谣言检测方法,能用多任务联合模型联合两个高度相关的任务,改进了谣言检测和立场分类任务,提高了谣言检测性能。

为达到上述目的而采用了一种基于多任务学习的社交媒体谣言检测方法,具体包括如下步骤:

S1:对社交媒体文本数据集中的语料进行数据提取及格式转换,获取帖子的源、回复及传播路径;

S2:对步骤1处理过后的语料提取行文风格的特征,处理为向量的形式;

S3:对步骤1处理过后的语料提取用户置信度的特征,处理为向量的形式;

S4:对来源帖子及回复帖子中的文本部分做文本预处理,并将文本编码为向量的形式以作为文本表示,来输入后续任务;

S5:将S2和S3提取到的特征与S4的文本表示做向量拼接;

S6:将拼接后的向量放入一个共享的BERT层,通过共享把子任务I立场检测和子任务II谣言检测的数据编码为同一个语义空间中的向量表示;

S7:分别构建子任务I立场检测和子任务II谣言检测的神经网络结构;

S8:将S5处理后的数据分别输入子任务I立场检测和子任务II谣言检测的神经网络结构中,进行子任务I的四分类任务和子任务II的三分类任务,输出立场分类和谣言分类。

作为本发明基于多任务学习的社交媒体谣言检测方法进一步的改进,S1中:

源帖子用s表示,回复用表示,源帖对应有多个回复,下标表示回复编号,回复对应的传播链用表示,可构成多条传播链,是自上而下的传播结构,的下标表示传播链编号,即s对应形成多分枝的树状结构会话。

作为本发明基于多任务学习的社交媒体谣言检测方法进一步的改进,S2中,行文风格的特征包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110269307.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top