[发明专利]一种知识图谱引导的假新闻检测方法有效
申请号: | 201911369712.X | 申请日: | 2019-12-26 |
公开(公告)号: | CN111061843B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 刘金硕;李晨曦;邓娟;李扬眉 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/36;G06F40/205;G06N3/0442;G06N3/0464;G06N3/048;G06N3/08 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 刘琰 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 引导 新闻 检测 方法 | ||
本发明公开了一种知识图谱引导的假新闻检测方法,包括:步骤1、基于假新闻检测数据集,构建知识图谱作为假新闻检测的背景知识,并预训练知识图谱嵌入模型;步骤2、抽取待检测新闻文本中的实体,并连接到知识图谱;步骤3、基于新闻文本与实体,获取新闻文本的词级别增强表示,并基于注意力机制提取新闻文本词级别特征;步骤4、获取新闻文本字级别表示,基于注意力机制抽取新闻文本字级别特征;步骤5、基于实体注意力模型,抽取新闻文本中的实体特征;步骤6、融合待检测新闻文本的词级别特征、字级别特征、实体特征,对待检测新闻文本进行真实性检测。本发明引入知识图谱来引导深度学习模型进行假新闻检测,提高了模型识别准确率与泛化性能。
技术领域
本发明涉及信息处理技术领域,尤其涉及一种知识图谱引导的假新闻检测方法。
背景技术
假新闻是一种有意且确实是虚假的新闻,可能会误导读者。近年来,随着互联网技术和社交网络的发展,互联网已经成为人们获取新闻信息的主要来源,随之产生的假新闻也成为近年来最热门的社会政治话题之一,并且在“美国大选”和“脱欧”之后受到特别关注。假新闻具有成本低、易于获取和快速传播的特点,容易误导公众舆论扰、乱社会秩序以及破坏社交媒体的信誉。因此需要研究假新闻检测,建立一个科学合理、行之有效、高效准确的假新闻检测发放,来对互联网中的假新闻进行有效的检测,达到快速准确识别假新闻的作用。这对于维护社会稳定和谐、提高社交媒体的信誉、心造科学安全的互联网环境具有十分积极的意义。
对于传统的假新闻检测模型,一部分研究从文本本身提取包括文本风格、情感特征等各种特征,并训练分类器来对新闻文本进行分类;一部分研究利用事实检测来进行假新闻的检测,主要是检测新闻内容与事实信息的冲突来判定新闻内容的真实性;一部分研究把假新闻检测任务当作普通的文本分类任务,使用深度学习模型对新闻文本本身抽取特征并进行分类。
发明人在研究假新闻检测的时候发现,现有方法都局限于从新闻文本本身抽取特征,而缺乏外部先验知识的引入。
发明内容
本发明要解决的技术问题在于针对现有技术中的缺陷,提供一种知识图谱引导的假新闻检测方法。
本发明解决其技术问题所采用的技术方案是:
本发明提供一种知识图谱引导的假新闻检测方法,该方法包括以下步骤:
步骤1、基于假新闻检测数据集,构建知识图谱作为假新闻检测的背景知识,并预训练知识图谱嵌入模型;
步骤2、抽取待检测新闻文本中的实体,并连接到知识图谱;
步骤3、基于新闻文本与实体,获取新闻文本的词级别增强表示,并基于注意力机制提取新闻文本词级别特征;
步骤4、获取新闻文本字级别表示,并基于注意力机制抽取新闻文本字级别特征;
步骤5、基于实体注意力模型,抽取新闻文本中的实体特征;
步骤6、融合待检测新闻文本的词级别特征、字级别特征、实体特征,对待检测新闻文本进行真实性检测。
进一步地,本发明的步骤1的具体方法为:
步骤1.1、获取假新闻检测任务的数据集,利用命名体识别模型与实体链接模型抽取数据集中的实体,并将实体链接到开源知识图谱中,将抽取出的实体作为种子节点,利用广度优先遍历算法在开源知识谱图中获取一个子图谱作为假新闻检测模型的先验知识;知识图谱记为G={(s,p,o)},其中(s,p,o)为三元组,s和o为实体,p为实体之间的关系;
步骤1.2、预训练图谱嵌入模型;利用步骤1.1中构建的知识图谱,使用TransE模型来预训练知识图谱嵌入模型,预训练的知识图谱嵌入模型记为Mkge。
进一步地,本发明的步骤1.2中预训练知识图谱嵌入模型的具体方法为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911369712.X/2.html,转载请声明来源钻瓜专利网。