[发明专利]一种融合证据可信度的虚假新闻检测方法有效
| 申请号: | 202310825631.6 | 申请日: | 2023-07-07 |
| 公开(公告)号: | CN116579337B | 公开(公告)日: | 2023-10-10 |
| 发明(设计)人: | 刘明铭;刘梦莹;吴一可;肖洋;王鹏程;胡梦婷 | 申请(专利权)人: | 南开大学 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06N3/0464;G06F16/951;G06F18/25 |
| 代理公司: | 天津展誉专利代理有限公司 12221 | 代理人: | 任海波 |
| 地址: | 300071*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 融合 证据 可信度 虚假 新闻 检测 方法 | ||
本发明涉及虚假新闻检测技术领域,提供一种融合证据可信度的虚假新闻检测方法。该方法包括:获取待测新闻,爬取获得待测新闻的真证据;通过人工智能程序生成待测新闻对应的假证据,根据待测新闻与真证据和假证据构建数据集;通过神经网络学习数据集,获得数据集的包括新闻特征和初步证据特征的初步特征表示;对初步证据特征进行迭代交叉验证并引入多头输入层,获得数据集中每条证据对应的多头可信度分数;根据多头可信度分数调制新闻特征和初步证据特征间的注意力权重获得整体证据特征;对整体证据特征进行卷积学习以检测待测新闻的真假。该方法模拟更不可信的证据场景,通过多头可信度来模拟不同可信度,提高了虚假新闻检测的准确率。
技术领域
本发明涉及虚假新闻检测技术领域,尤其涉及一种融合证据可信度的虚假新闻检测方法。
背景技术
现今在基于证据的虚假新闻检测方向的研究已有很多,很多模型在Snopes以及PolitiFact等常用数据集上取得了很好的效果,其中的新闻及标签在事实核查网站得到,证据通过在搜索引擎中通过检索新闻得到,一条新闻对应若干条证据。现有的工作将新闻以及证据作为输入,通过门控循环单元(GRU)、长短期记忆网络(LSTM)或门控图神经网络(GGNN)等对输入进行编码,之后通过注意力机制建立新闻和证据之间的联系得到证据的特征表示,最后由新闻和证据的特征一起通过一个全连接层以及softmax函数得到新闻为真或假的概率,选取概率最大的作为预测结果。
首先,Snopes和PolitiFact在获取证据后进行数据清洗时,是提取爬行证据中最相似的片段,片段的词嵌入与索赔之间的相似性至少为0.5。这种数据处理使得数据集过于干净,数据集中也有很多新闻的证据仅有1个,这是不符合现实情况的,因为对于一条新闻的检索结果不会只有一条,这无法反映真实情况,可能会导致在这些数据集上表现良好的模型在真实世界的应用程序中出现显著的性能下降。
现有的基于证据的虚假新闻检测方法都通过注意力机制等方法建模了claim和证据之间的关系,提升了模型性能,但也都忽略了一个至关重要的问题,是这些被用于进行虚假新闻检测的证据本身是否可信,用于虚假新闻检测的证据来源于搜索引擎检索,可想而知这其中必会存在一些不可信的证据,甚至会有一些恶意攻击者散布的带有模型攻击性的假证据来干扰虚假新闻检测模型的预测结果,这会使得现有模型因缺少对证据是否可信的判断而使用了假证据作为新闻检测的依据,从而对新闻的真假给出了错误判断。
此外其它研究包括DeClarE、MAC和GET使用到了证据的来源作为证据文本特征的一个补充,但模型对证据可信程度的理解仅依靠来源是远远不够的,并且新的来源层出不穷,一旦有攻击者捏造的证据来源是模型没见过的,模型根本无法判断证据是否可信。
发明内容
本发明旨在至少解决相关技术中存在的技术问题之一。为此,本发明提供一种融合证据可信度的虚假新闻检测方法。
本发明提供一种融合证据可信度的虚假新闻检测方法,包括:
S100:获取待测新闻,爬取所述待测新闻的真证据;
S200:通过人工智能程序生成所述待测新闻对应的假证据,根据所述待测新闻与所述真证据和所述假证据构建数据集;
S300:通过神经网络学习所述数据集,获得所述数据集的初步特征表示,所述初步特征表示包括新闻特征和初步证据特征;
S400:对所述初步证据特征进行迭代交叉验证并引入多头输出层,获得所述数据集中每条真证据和假证据对应的多头可信度分数;
S500:根据所述多头可信度分数调制所述新闻特征和所述初步证据特征间的注意力权重,获得所述数据集的整体证据特征;
S600:对所述整体证据特征进行卷积学习,获得所述待测新闻的真假检测结果。
根据本发明提供的一种融合证据可信度的虚假新闻检测方法,步骤S100包括:
S110:基于现有数据库获取待测新闻;
S120:通过爬虫工具对所述待测新闻重新爬取新闻文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310825631.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多用途切菜机
- 下一篇:一种阴道菌群分子分型试剂盒及其使用方法





