[发明专利]一种知识图谱引导的假新闻检测方法有效

专利信息
申请号: 201911369712.X 申请日: 2019-12-26
公开(公告)号: CN111061843B 公开(公告)日: 2023-08-25
发明(设计)人: 刘金硕;李晨曦;邓娟;李扬眉 申请(专利权)人: 武汉大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/35;G06F16/36;G06F40/205;G06N3/0442;G06N3/0464;G06N3/048;G06N3/08
代理公司: 湖北武汉永嘉专利代理有限公司 42102 代理人: 刘琰
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 知识 图谱 引导 新闻 检测 方法
【说明书】:

发明公开了一种知识图谱引导的假新闻检测方法,包括:步骤1、基于假新闻检测数据集,构建知识图谱作为假新闻检测的背景知识,并预训练知识图谱嵌入模型;步骤2、抽取待检测新闻文本中的实体,并连接到知识图谱;步骤3、基于新闻文本与实体,获取新闻文本的词级别增强表示,并基于注意力机制提取新闻文本词级别特征;步骤4、获取新闻文本字级别表示,基于注意力机制抽取新闻文本字级别特征;步骤5、基于实体注意力模型,抽取新闻文本中的实体特征;步骤6、融合待检测新闻文本的词级别特征、字级别特征、实体特征,对待检测新闻文本进行真实性检测。本发明引入知识图谱来引导深度学习模型进行假新闻检测,提高了模型识别准确率与泛化性能。

技术领域

本发明涉及信息处理技术领域,尤其涉及一种知识图谱引导的假新闻检测方法。

背景技术

假新闻是一种有意且确实是虚假的新闻,可能会误导读者。近年来,随着互联网技术和社交网络的发展,互联网已经成为人们获取新闻信息的主要来源,随之产生的假新闻也成为近年来最热门的社会政治话题之一,并且在“美国大选”和“脱欧”之后受到特别关注。假新闻具有成本低、易于获取和快速传播的特点,容易误导公众舆论扰、乱社会秩序以及破坏社交媒体的信誉。因此需要研究假新闻检测,建立一个科学合理、行之有效、高效准确的假新闻检测发放,来对互联网中的假新闻进行有效的检测,达到快速准确识别假新闻的作用。这对于维护社会稳定和谐、提高社交媒体的信誉、心造科学安全的互联网环境具有十分积极的意义。

对于传统的假新闻检测模型,一部分研究从文本本身提取包括文本风格、情感特征等各种特征,并训练分类器来对新闻文本进行分类;一部分研究利用事实检测来进行假新闻的检测,主要是检测新闻内容与事实信息的冲突来判定新闻内容的真实性;一部分研究把假新闻检测任务当作普通的文本分类任务,使用深度学习模型对新闻文本本身抽取特征并进行分类。

发明人在研究假新闻检测的时候发现,现有方法都局限于从新闻文本本身抽取特征,而缺乏外部先验知识的引入。

发明内容

本发明要解决的技术问题在于针对现有技术中的缺陷,提供一种知识图谱引导的假新闻检测方法。

本发明解决其技术问题所采用的技术方案是:

本发明提供一种知识图谱引导的假新闻检测方法,该方法包括以下步骤:

步骤1、基于假新闻检测数据集,构建知识图谱作为假新闻检测的背景知识,并预训练知识图谱嵌入模型;

步骤2、抽取待检测新闻文本中的实体,并连接到知识图谱;

步骤3、基于新闻文本与实体,获取新闻文本的词级别增强表示,并基于注意力机制提取新闻文本词级别特征;

步骤4、获取新闻文本字级别表示,并基于注意力机制抽取新闻文本字级别特征;

步骤5、基于实体注意力模型,抽取新闻文本中的实体特征;

步骤6、融合待检测新闻文本的词级别特征、字级别特征、实体特征,对待检测新闻文本进行真实性检测。

进一步地,本发明的步骤1的具体方法为:

步骤1.1、获取假新闻检测任务的数据集,利用命名体识别模型与实体链接模型抽取数据集中的实体,并将实体链接到开源知识图谱中,将抽取出的实体作为种子节点,利用广度优先遍历算法在开源知识谱图中获取一个子图谱作为假新闻检测模型的先验知识;知识图谱记为G={(s,p,o)},其中(s,p,o)为三元组,s和o为实体,p为实体之间的关系;

步骤1.2、预训练图谱嵌入模型;利用步骤1.1中构建的知识图谱,使用TransE模型来预训练知识图谱嵌入模型,预训练的知识图谱嵌入模型记为Mkge

进一步地,本发明的步骤1.2中预训练知识图谱嵌入模型的具体方法为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911369712.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top